«Мне было интересно установить базовый уровень того, когда большие языковые модели (LLM) действительно способны решать открытые математические задачи, и где они испытывают трудности», — сказал Сомани. Удивительно, но с использованием новейшей модели этот рубеж начал немного смещаться.
Цепочка рассуждений (chain of thought) ChatGPT впечатляет еще больше: модель выдает математические аксиомы, такие как формула Лежандра, постулат Бертрана и теорема о Звезде Давида. В конечном итоге модель нашла пост на Math Overflow от 2013 года, где математик из Гарварда Ноам Элкис представил элегантное решение схожей задачи. Однако окончательное доказательство ChatGPT существенно отличалось от работы Элкиса и представляло собой более полное решение версии задачи, предложенной легендарным математиком Полом Эрдёшем, чья обширная коллекция нерешенных проблем стала полигоном для испытаний искусственного интеллекта.
Для всех, кто скептически относится к машинному интеллекту, это удивительный результат — и не единственный. Инструменты ИИ стали вездесущими в математике: от LLM, ориентированных на формализацию, таких как Aristotle от Harmonic, до инструментов для обзора литературы, таких как Deep Research от OpenAI. Но с момента выпуска GPT 5.2 — который Сомани описывает как «анекдотически более компетентный в математических рассуждениях, чем предыдущие итерации» — объемы решенных задач стало трудно игнорировать, что ставит новые вопросы о способности больших языковых моделей расширять границы человеческого знания.
Сомани изучал проблемы Эрдёша — набор из более чем тысячи гипотез венгерского математика, которые поддерживаются в сети. Эти задачи стали соблазнительной целью для математики, управляемой ИИ, поскольку они значительно различаются как по тематике, так и по сложности. Первая партия автономных решений поступила в ноябре от модели на базе Gemini под названием AlphaEvolve, но совсем недавно Сомани и другие обнаружили, что GPT 5.2 демонстрирует поразительную адаптивность в высшей математике.
С Рождества 15 задач на веб-сайте Эрдёша были переведены из категории «открытые» в «решенные», и в 11 из этих решений в качестве участника процесса прямо указаны модели ИИ.
Уважаемый математик Теренс Тао более взвешенно оценивает прогресс на своей странице GitHub, отмечая восемь различных задач, где модели ИИ добились значительного автономного прорыва в решении проблемы Эрдёша, и еще шесть случаев, когда прогресс был достигнут за счет обнаружения и развития предыдущих исследований. Это далеко от того, чтобы системы ИИ могли заниматься математикой без вмешательства человека, но очевидно, что у больших моделей есть важная роль.
В Mastodon Тао предположил, что масштабируемость систем ИИ делает их «лучше приспособленными для систематического применения к “длинному хвосту” малоизвестных проблем Эрдёша, многие из которых на самом деле имеют прямолинейные решения».
«Таким образом, многие из этих более простых задач Эрдёша теперь с большей вероятностью будут решены чисто с помощью методов ИИ, нежели человеческими или гибридными средствами», — продолжил Тао.
Еще одним движущим фактором стал недавний сдвиг в сторону формализации — трудоемкой задачи, которая облегчает проверку и расширение математических рассуждений. Формализация не требует использования ИИ или даже компьютеров, но новый набор автоматизированных инструментов значительно упростил этот процесс. Разработанный в Microsoft Research в 2013 году, открытый «помощник по доказательствам» Lean получил широкое распространение в этой области как способ формализации доказательств, а инструменты ИИ, такие как Aristotle от Harmonic, обещают автоматизировать значительную часть работы по формализации.
Для основателя Harmonic Тюдора Ачима внезапный скачок в решении задач Эрдёша менее важен, чем тот факт, что величайшие математики мира начинают всерьез относиться к этим инструментам. «Меня больше волнует то, что профессора математики и информатики используют [инструменты ИИ]», — сказал Ачим. «Эти люди дорожат своей репутацией, поэтому, когда они говорят, что используют Aristotle или ChatGPT, это является реальным доказательством».
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Russell Brandom




