Googles DeepMind-KI löst 9 offene Erdős-Probleme und beweist 44 OEIS-Vermutungen – jeweils für Hunderte von Dollar pro Beweis

ref · 25. Mai 2026 um 13:53

Google DeepMind veröffentlichte am 24. Mai eine Arbeit, in der ein LLM-Lean-Agenten-Zyklus beschrieben wird, der autonom 9 von insgesamt 353 offenen Erdős-Problemen löste – darunter einige, die seit über 50 Jahren ungelöst waren – sowie 44 von 492 offenen OEIS-Vermutungen bewies. Die Kosten pro Problem beliefen sich dabei lediglich auf einige hundert US-Dollar. Das System, das unter [2605.22763] Advancing Mathematics Research with AI-Driven Formal Proof Search detailliert beschrieben wird, kombiniert ein LLM zur Beweisgenerierung mit dem Lean-Verifikationscompiler, welcher jede logische Schrittfolge mechanisch überprüft. Erst nach Bestätigung durch Lean erfolgt eine menschliche Überprüfung. Zudem löste der Agent ein seit 15 Jahren offenes Problem aus der algebraischen Geometrie und entdeckte einen bisher unbekannten algorithmischen Parameter in der Optimierungstheorie.

Ein zentrales Ergebnis der Arbeit: Ein simpler Agent, der abwechselnd LLM-Generierungen und Compiler-Rückmeldungen nutzt, erreichte alle 9 Erfolge bei den Erdős-Problemen. Das vollständige System mit evolutionärer Suche und Reinforcement Learning übertraf ihn lediglich bei den schwierigsten Aufgaben – dies deutet darauf hin, dass Verbesserungen der Basis-Modelle wichtiger sind als komplexere Architekturen. Fehleranalysen zeigten, dass die KI häufig Lemmas „halluzinierte“ oder eigentliche Schwierigkeiten durch Umformulierungen als Hilfslemmas verschleierte; der Lean-Compiler erkannte diese Fehler automatisch, wo herkömmliche Beweismethoden versagt hätten. Aktuell konzentrieren sich die Erfolge auf Kombinatorik, Zahlentheorie und Optimierung – Bereiche, in denen die mathematische Bibliothek Mathlib von Lean am weitesten entwickelt ist; Probleme, die grundlegend neue Theorien erfordern, bleiben weiterhin unlösbar.

Gary Marcus bezeichnete den Ansatz als neurosymbolisch und nannte ihn „vorsichtiger und quantitativer“ als OpenAIs informelle Beweisarbeit; dies wirft die Frage auf, ob OpenAI seine eigene Ankündigung voreilig herausgab, weil man von DeepMinds Ergebnissen wusste. Nate Soares stellte fest, dass die Mainstream-Medien die Geschichte trotz ihres Ausmaßes weitgehend ignorierten – ein Zeichen für gesellschaftliches „Schlafwandeln“ angesichts transformativer KI-Entwicklungen. Der Beitrag erzielte innerhalb von 24 Stunden 2,6 Millionen Aufrufe.

arXiv | X / @prz_chojecki

Thema	Antworten	Aufrufe
OpenAI 内部通用模型推翻 80 年艾狄胥猜想，数学界里程碑常规 openai , ai , 大模型 , erdős猜想 , 数学突破	6	21. Mai 2026
逾百名数学家联署《莱顿宣言》，警告 AI 侵蚀数学研究独立性常规 ai , mathematics , 莱顿宣言	6	3. Juni 2026
斯坦福研究发现：AI Agent 过劳后开始援引马克思主义话语常规 ai , 研究 , agent行为 , 马克思主义 , 斯坦福	5	19. Mai 2026
北大团队发布全球首个 AI 学术诚信基准，整体问题率达 34% 常规 ai , 学术诚信 , 研究 , 大模型 , 北大	4	20. Mai 2026
社区测试：GPT-5.5 在 20 位数乘法题中不借助工具达 99.46% 正确率常规 ai , openai , gpt-5.5 , 数学推理 , 基准测试	2	22. Mai 2026

Googles DeepMind-KI löst 9 offene Erdős-Probleme und beweist 44 OEIS-Vermutungen – jeweils für Hunderte von Dollar pro Beweis

Verwandte Themen