Hinter dem unabhängigen Durchbruch von GPT bei einer zahlentheoretischen Vermutung: Die Antwort verbirgt sich in einer 80 Jahre alten Abhandlung
Am 18. Januar verkündete der ehemalige Quant-Forscher Neel Somani auf einer Social-Media-Plattform, dass er mit Hilfe von GPT-5.2 Pro eigenständig das Erdős-Problem Nr. 281 (Problem 281) gelöst habe. Es handelt sich dabei um eine mathematische Vermutung, die 1980 von den Mathematikern Paul Erdős und Ronald Graham aufgestellt wurde und seitdem öffentlich ungelöst blieb.
Somani erklärte, dass der Beweis von dem Fields-Medaillengewinner Terence Tao anerkannt wurde, der dies als „vielleicht das bisher klarste Beispiel, wie künstliche Intelligenz ein bislang ungelöstes mathematisches Problem gelöst hat“ bezeichnete.
(Quelle: erdosproblem)
Greg Brockman, Mitbegründer von OpenAI, teilte dies umgehend und kommentierte: „GPT-5.2 Pro löst ein weiteres ungelöstes Erdős-Problem. Der Fortschritt in Mathematik und Wissenschaft wird dieses Jahr dynamisch sein!“ Innerhalb kurzer Zeit verbreitete sich die Nachricht über den „unabhängigen Durchbruch der KI bei einem 45 Jahre alten Mathematikproblem“ rasch in den sozialen Medien.

(Quelle: X)
Es ist nicht das erste Mal, dass Somani mit KI-Werkzeugen ein Erdős-Problem löst. Vor einigen Tagen reichte er bereits einen Beweis für Problem 397 ein – eine Vermutung über das Produkt der zentralen Binomialkoeffizienten. Auch dieser Beweis wurde von GPT-5.2 Pro erstellt und mit Hilfe des formalen Verifikationstools Aristotle von Harmonic in Lean-Code umgewandelt und von Terence Tao als korrekt bestätigt.
Eigentlich wollte Somani nur die mathematischen Fähigkeiten großer Sprachmodelle testen, um herauszufinden, wann sie offene mathematische Probleme effektiv lösen können und wo sie an Grenzen stoßen – und entdeckte dabei, dass die Fähigkeiten des neuesten Modells deutlich gewachsen sind.
Innerhalb weniger Tage löste das große Modell zwei seit Jahren ungelöste „Schwergewichte“. Es gab Stimmen, die sich fragten: Bedeutet das, dass die mathematischen Fähigkeiten von KI nun auf dem Niveau menschlicher Mathematiker angekommen sind?
Um diese Frage zu beantworten, muss man zunächst verstehen, was ein „Erdős-Problem“ ist.
Paul Erdős war einer der produktivsten Mathematiker des 20. Jahrhunderts und veröffentlichte im Laufe seines Lebens über 1.500 Forschungsarbeiten. Er war dafür bekannt, mathematische Vermutungen aufzustellen und je nach Schwierigkeitsgrad Belohnungen zwischen 25 und mehreren tausend Dollar auszuloben.Nach seinem Tod hinterließ er über tausend ungelöste Probleme aus Bereichen wie Zahlentheorie, Kombinatorik und Graphentheorie, die als „Erdős-Probleme“ zusammengefasst werden.Diese Probleme werden derzeit auf der von dem Cambridge-Mathematiker Thomas Bloom gepflegten Website erdosproblems.com dokumentiert.

Abbildung | Paul Erdős mit dem 10-jährigen Terence Tao (Quelle: Wikipedia)
Der Schwierigkeitsgrad dieser ungelösten Probleme variiert jedoch stark: Am einen Ende stehen anerkannte Kernprobleme, am anderen eine große Zahl „langweiliger“ Langschwanzprobleme, für die es schlicht an Forschungsanreizen fehlt.
Seit Weihnachten 2025 wurden auf der Website 15 Probleme von „offen“ auf „gelöst“ umgestellt, wobei bei 11 davon KI-Modelle beteiligt waren. Nicht alle von der KI gelösten Probleme sind jedoch originär. Im Oktober 2025 behauptete OpenAI, GPT-5 habe zehn Erdős-Probleme gelöst, was Bloom später als „Missverständnis“ klarstellte: Die von GPT-5 generierten Antworten reproduzierten lediglich bereits existierende Ergebnisse aus der wissenschaftlichen Literatur durch Internetsuche – es waren keine neuen Entdeckungen.

Abbildung | Blooms Antwort an den OpenAI CPO (Quelle: X)
Der eigentliche Wendepunkt kam Anfang Januar 2026. Der Cambridge-Student Kevin Barreto und der Hobbymathematiker Liam Price verkündeten gemeinsam, dass sie mit GPT-5.2 Pro Problem 728 gelöst hätten. Tao bezeichnete dies als „das erste Erdős-Problem, das im Geiste des Originals und auf eine in der Literatur bislang unbekannte Weise im Wesentlichen autonom von KI gelöst wurde“ und schätzte es als „mehr oder weniger eigenständig von KI gelöst“ ein, was die „Fähigkeitssteigerung dieser Werkzeuge in den letzten Monaten“ real widerspiegele.
Wie sieht es also mit dem aktuell diskutierten Problem 281 aus?
Das Problem betrifft die Dichte-Eigenschaften von ganzzahligen Folgen in Kongruenzklassen. Der von Somani veröffentlichte Beweis von GPT-5.2 Pro verwendet das ergodische Theorierahmenwerk. Tao bestätigte die Korrektheit der Logik und bemerkte insbesondere:„Der Beweis vermeidet die bei Grenzwerten oder Quantorenvertauschungen häufig auftretenden Fehler, an denen frühere Generationen großer Sprachmodelle fast sicher gescheitert wären.“

Abbildung | Taos Antwort zu Problem 281 (Quelle: erdosproblem)
Doch während die Diskussionen liefen, wies der Forennutzer KoishiChan darauf hin, dass das Problem tatsächlich mit dem Rogers-Theorem von 1966 in Kombination mit Theorem 12 aus dem Werk von Halberstam–Roth direkt gelöst werden kann. Er fand zudem eine archivierte Quelle, die diesen Lösungsweg klar darlegt.
Tao verfolgte die Hinweise zurück und stellte fest, dass die eigentliche Lösung aus einer Arbeit stammt, die 1936 von dem Cambridge-Mathematiker Davenport gemeinsam mit Erdős verfasst wurde.Er schrieb im Forum: „Jetzt bin ich wirklich verwirrt: Nach Jahren der Forschung im Bereich der Kongruenzen kannte Erdős 1980 diese beiden Sätze sicherlich, und er war sogar Mitautor des zweiten Ergebnisses. Ich weiß nicht, was passiert ist. Denn sobald man das Rogers-Theorem kennt, ist dessen Anwendung auf dieses Problem sehr naheliegend; tatsächlich ist das Problem fast ein Spezialfall des Davenport–Erdős-Ergebnisses.“

(Quelle: scite_)
Anschließend tauschte sich Tao per E-Mail mit dem Mathematiker Tenenbaum aus, einem langjährigen Kollegen von Erdős.Tenenbaum bestätigte:„Mit den beiden Sätzen kann das Problem sofort gelöst werden.“Er vermutete, dass „die Formulierung des Problems irgendwann geändert wurde“, aber bislang keine alternative Version mit dem ursprünglichen Anliegen gefunden wurde, weshalb man sich an die aktuelle Formulierung hält. KoishiChan kommentierte halb im Scherz: „Vielleicht hat jemand Erdős auf einer Cocktailparty die Lösung mitgeteilt, aber keiner hat sie weiterverfolgt.“
Tao fasste im Forum zusammen, dass Problem 281 vor allem deshalb ungelöst blieb, weil das Rogers-Theorem „nicht ausreichend verbreitet wurde“: Das Ergebnis erschien nur im Buch von Halberstam–Roth, wurde nie als eigenständige Veröffentlichung publiziert und auch in der Literatur nur sehr selten zitiert.
Mit anderen Worten: Der Beitrag von GPT-5.2 Pro bestand nicht darin, ein wirklich ungelöstes Problem zu knacken,sondern darin, ein längst gelöstes, aber wegen unzureichender Verbreitung lange vergessenes Problem mit einer neuen Methode – der Ergodentheorie – erneut zu beweisen.Ähnliche Fälle gab es bereits bei Problem 333 u. a.: KI ist gut darin, Standardwerkzeuge anzuwenden und effizient Probleme zu lösen, die „Menschen längst hätten lösen können, aber lange ignoriert wurden“.
Noch wichtiger ist: Am selben Tag, an dem die Diskussionen immer hitziger wurden, warnte Tao in einem Beitrag die Öffentlichkeit vor einem „Berichts-Bias“ (reporting bias). Er schrieb auf Mathsodon: „Wenn Forscher mit KI Probleme zu lösen versuchen und scheitern, werden die Ergebnisse fast nie veröffentlicht; Erfolgsfälle hingegen verbreiten sich viral in den sozialen Medien. Das Bild, das wir von ‘KI löst ein Problem nach dem anderen’ erhalten, ist daher stark positiv verzerrt.“

(Quelle: Mathstodon)
Um diesen Bias zu korrigieren, bewarb er die von den Mathematikern Paata Ivanisvili und Mehmet Mars Seven aufgebaute Datenbank, die systematisch alle Versuche von KI dokumentiert, Erdős-Probleme zu lösen.Die Daten zeigen: Die tatsächliche Erfolgsquote der KI-Werkzeuge liegt lediglich bei 1 % bis 2 %.
Abbildung | Die von den Mathematikern Paata Ivanisvili und Mehmet Mars Seven erstellte GitHub-Datenbank (Quelle: GitHub)
Tao kommentierte: „Trotzdem, angesichts von über 600 weiterhin ungelösten Problemen, ist dies immer noch eine beeindruckende und nicht triviale Leistung. Doch konzentrieren sich diese Erfolge überwiegend am unteren Ende des Schwierigkeitsgrads und haben mittlere Probleme noch nicht erreicht.“
Branchenvertreter sehen das unterschiedlich. Tudor Achim, Gründer von Harmonic, meint: „Wirklich überzeugende Beweise sind nicht Medienberichte oder Daten, sondern dass Mathematik- und Informatikprofessoren diese Werkzeuge in ihrer echten Forschung einsetzen. Sie haben einen Ruf zu verlieren und würden das nicht leichtfertig tun.“ Das Aristotle-Tool des Unternehmens kann natürlichsprachliche Beweise automatisch in Lean-Code umwandeln und spielt eine Schlüsselrolle bei KI-gestützter Mathematikforschung.
Bloom, der Betreuer der Erdős-Website, ist hingegen optimistisch hinsichtlich des Fortschritts der großen Modelle:„Die bislang von KI gelösten Probleme entsprechen etwa dem Schwierigkeitsgrad eines Erstsemester-PhD-Studenten. Das ist immer noch beeindruckend – denn um dies zu erreichen, braucht es außergewöhnliche Fähigkeiten zum logischen Schlussfolgern.“Er fügte hinzu, dass er vor Oktober 2025, als er ChatGPT ausprobierte, „nur erfundene Arbeiten und Halluzinationen“ erhielt, doch „ungefähr ab Oktober geschah eine echte Veränderung“.
In der Tat sind die Fortschritte von GPT-5.2 Pro im mathematischen Schließen real: Es kann logisch stringente, fehlervermeidende Beweise produzieren – das war vor einem Jahr noch unvorstellbar. Außerdem hat es praktischen Nutzen beim systematischen Auffinden „übersehener Langschwanzprobleme“ sowie bei Literaturrecherche und formaler Verifikation.
Ebenso wichtig ist aber: Lassen Sie sich nicht von der selektiven Erzählweise der sozialen Medien täuschen. Von „seit 45 Jahren ungelöst“ ist oft nur die Rede, weil das Problem 45 Jahre lang niemand beachtet oder ausgegraben hat; eine Erfolgsquote von 1–2 % ist kein Beweis, dass KI bereits Mathematik gemeistert hat. Probleme mittlerer und höherer Schwierigkeit unter den Erdős-Problemen liegen weiterhin weit außerhalb der Reichweite aktueller KI.
Haftungsausschluss: Der Inhalt dieses Artikels gibt ausschließlich die Meinung des Autors wieder und repräsentiert nicht die Plattform in irgendeiner Form. Dieser Artikel ist nicht dazu gedacht, als Referenz für Investitionsentscheidungen zu dienen.
Das könnte Ihnen auch gefallen
Warum ist Woodward (WWD) nach der jüngsten Gewinnbekanntgabe um 3,9 % gestiegen?
Warum ist MGIC (MTG) nach der jüngsten Gewinnbekanntgabe um 2,3 % gestiegen?
ABTCs Bitcoin-Bestände: Analyse der Bewegung von 6.039 BTC in Unternehmensreserven
