ИИ-агент от Google DeepMind решил 9 открытых задач Эрдёша и доказал 44 гипотезы из OEIS; стоимость каждого доказательства составляет сотни долларов

ref · 25.Май.2026 13:53:13

24 мая компания Google DeepMind опубликовала статью, в которой описывается работа автономного агента LLM-Lean. Этот агент самостоятельно решил 9 из 353 открытых задач Эрдёша — некоторые из них оставались нерешёнными более 50 лет — и доказал 44 из 492 гипотез OEIS, при этом затраты на решение каждой задачи составили всего несколько сотен долларов. Подробности системы изложены в публикации на сайте arXiv ([2605.22763] Advancing Mathematics Research with AI-Driven Formal Proof Search). В её основе лежит использование языка больших моделей для формулировки доказательств и компилятора Lean для их формальной проверки; последний автоматически анализирует каждый логический шаг. Человеческая проверка проводится лишь после того, как Lean подтверждает корректность выводов. Кроме того, агент разрешил проблему из области алгебраической геометрии, которая оставалась нерешённой 15 лет, и обнаружил новый алгоритмический параметр в теории оптимизации.

Один из ключевых выводов статьи заключается в том, что даже простой агент, чередующий генерацию текста с помощью LLM и получение обратной связи от компилятора, смог повторить все 9 успехов в решении задач Эрдёша. Более сложная система, включающая эволюционный поиск и обучение с подкреплением, демонстрирует превосходство лишь при решении наиболее трудных задач; это позволяет предположить, что усовершенствование базовых моделей важнее усложнения архитектуры системы. Анализ ошибок показал, что ИИ часто «выдумывал» вспомогательные утверждения и скрывал суть проблем, переформулируя их в виде таких утверждений; компилятор Lean безошибочно выявлял эти недочёты, чего не удавалось добиться при использовании неформальных методов доказательства. На данный момент успехи агента наблюдаются в комбинаторике, теории чисел и оптимизации — областях, где математическая библиотека Lean (Mathlib) наиболее развита; задачи, требующие создания совершенно новых теоретических концепций, пока остаются ему недоступными.

Гэри Маркус охарактеризовал данный подход как нейросимвольный и назвал его «более взвешенным и количественно обоснованным», чем неформальные попытки доказательств со стороны OpenAI; это породило вопрос: не спешило ли само OpenAI с публикацией собственных результатов, зная о грядущем прорыве DeepMind. Нейт Соарес отметил, что основные СМИ практически проигнорировали это событие, объяснив это «сонным состоянием» общества перед лицом появления трансформационных технологий ИИ. За первые сутки публикация набрала 2,6 миллиона просмотров.

arXiv | X / @prz_chojecki

Тема	Ответов	Просм.
OpenAI 内部通用模型推翻 80 年艾狄胥猜想，数学界里程碑常规 openai , ai , 大模型 , erdős猜想 , 数学突破	6	21.05.2026
逾百名数学家联署《莱顿宣言》，警告 AI 侵蚀数学研究独立性常规 ai , mathematics , 莱顿宣言	6	03.06.2026
斯坦福研究发现：AI Agent 过劳后开始援引马克思主义话语常规 ai , 研究 , agent行为 , 马克思主义 , 斯坦福	5	19.05.2026
北大团队发布全球首个 AI 学术诚信基准，整体问题率达 34% 常规 ai , 学术诚信 , 研究 , 大模型 , 北大	4	20.05.2026
社区测试：GPT-5.5 在 20 位数乘法题中不借助工具达 99.46% 正确率常规 ai , openai , gpt-5.5 , 数学推理 , 基准测试	2	22.05.2026

ИИ-агент от Google DeepMind решил 9 открытых задач Эрдёша и доказал 44 гипотезы из OEIS; стоимость каждого доказательства составляет сотни долларов

Связанные темы