
Недавно в Калифорнии состоялась встреча тридцати ведущих мировых математиков, организованная некоммерческой организацией Epoch AI. Их целью было испытать новую разработку компании OpenAI — чат-бот o4-mini, обладающий сложными логическими возможностями. Учёные попытались создать задачи, которые оказались бы слишком трудными для решения искусственным интеллектом. Но оказалось, что o4-mini с ними справился и превзошёл все ожидания
Для проверки возможностей o4-mini был подготовлен специальный набор из трёхсот уникальных математических задач различного уровня сложности. Отмечается, что предыдущие версии ИИ могли справиться менее чем с двумя процентами таких задач. Что касается o4-mini, то он уже на начальном этапе успешно решил примерно двадцать процентов задач.
Участникам мероприятия было предложено разработать десять наиболее сложных задач, каждая из которых принесла бы задумщику 7500 долларов, если бы o4-mini не смог её решить.
В итоге, во время испытания o4-mini проявил себя как настоящий учёный. Например, профессор математики Кен Оно предложил сложную задачу из теории чисел, аналогичную докторским диссертациям. Нейросеть быстро нашла научные материалы, решила тренировочную версию задачи и предоставила правильное решение основной задачи. Это вызвало большое удивление среди участников, многие из которых отметили способность o4-mini действовать как талантливый студент или молодой специалист.
Хотя o4-mini не смог решить все предложенные задачи, участники признались, что уровень производительности и скорость обработки материала превысили их ожидания. Некоторые учёные опасаются, что такие системы могут изменить традиционную роль учёных-математиков, заставляя их играть роль наставников для нейросетей.