Künstliche Intelligenz schreibt Gedichte, doch an der Mathematik scheitert sie. Warum schaffen ChatGPT und andere Chatbots nicht mal grundlegende Rechenaufgaben? Wir enthüllen die Ursachen der mathematischen Pannen der KI, von der Tokenisierung, die Zahlen in unverständliche Fragmente zerlegt, bis hin zum statistischen Ansatz des Lernens, der in der Mathematik versagt.
Künstliche Intelligenz, einschließlich ChatGPT, kann Gedichte schreiben, Musik komponieren und Texte übersetzen. Dennoch scheitert sie oft an einfachen mathematischen Aufgaben. Warum kommt ein Chatbot, der komplexe Sprachaufgaben bewältigt, nicht mit Mathematik auf dem Niveau der Grundschule zurecht?
Eines der Schlüsselprobleme ist die Tokenisierung. Dieser Prozess teilt Daten in kleinere Teile, sogenannte Token. Stellen Sie sich das wie ein Puzzle vor, bei dem Wörter in Silben zerlegt werden. Der Tokenisierer, das künstliche Intelligenz-Modell, das für diesen Prozess verantwortlich ist, versteht jedoch nicht den Bedeutungsgehalt von Zahlen.
Es kann passieren, dass die Zahl 380 als ein Token wahrgenommen wird, während 381 als zwei (38 und 1) wahrgenommen wird. Dadurch werden die Beziehungen zwischen Ziffern gestört und die Berechnung wird komplizierter.
Ein weiterer Grund für die mathematischen Probleme von ChatGPT ist seine statistische Natur. Der Chatbot lernt anhand einer großen Menge von Beispielen und sucht darin nach Mustern. Beispielsweise lernt er, dass die Phrase „Sehr geehrter Herr“ oft durch die Phrase „wenden wir uns an Sie“ folgt.
In der Mathematik trifft dieser Ansatz jedoch auf Probleme. Zwar kann ChatGPT schätzen, dass das Produkt von Zahlen, die auf 2 enden, mit 4 endet, aber mit Zwischenergebnissen kommt es nicht zurecht. Einfach gesagt versucht das ChatGPT-Modell, das Ergebnis anhand der erlernten Muster zu erraten, anstatt eine genaue Berechnung durchzuführen.
Eine Studie von Yuntian Deng von der University of Waterloo hat gezeigt, dass ChatGPT Probleme mit der Multiplikation von Zahlen mit mehr als vier Ziffern hat. Der Grund dafür ist, dass ein Fehler in einem der Rechenschritte sich im Endergebnis widerspiegelt.
Stellen Sie sich das wie einen Domino-Effekt vor – ein Fehler löst eine Kettenreaktion aus und das Ergebnis liegt komplett daneben. Doch es gibt Hoffnung, dass sich ChatGPT in Zukunft verbessert. Deng und seine Kollegen testeten auch das Model o1 von OpenAI, das sich durch seine Fähigkeit des logischen Denkens auszeichnet.
Dieses Model erzielte deutlich bessere Ergebnisse als das Standard-GPT-4o und konnte sogar Multiplikationen von neunstelligen Zahlen korrekt lösen. Das o1-Modell denkt Schritt für Schritt über das Problem nach, was ihm ermöglicht, genauere Ergebnisse zu erzielen.
Das Projekt Stargate ist eine ehrgeizige Initiative zur Schaffung einer Infrastruktur für künstliche Intelligenz in den USA. Ziel ist es, in den nächsten vier Jahren 500 Milliarden Dollar zu investieren. Das Projekt, unterstützt von Giganten wie OpenAI, SoftBank und Microsoft, verspricht Tausende von Arbeitsplätzen und die wirtschaftliche Dominanz der USA.
RoboMind ist ein pädagogisches Werkzeug, das dazu dient, die Grundlagen der Programmierung mithilfe eines virtuellen Roboters zu erlernen. Es verwendet die einfache Programmiersprache Robo, die eine geeignete Wahl für Anfänger darstellt. Die Schüler lernen mit ihrer Hilfe algorithmisches Denken durch praktische Aufgaben wie das Navigieren durch ein Labyrinth oder das Manipulieren von Objekten.
Minecraft: Education Edition verbindet die populäre Spielwelt mit dem Lernen. Kinder können Programmieren entdecken, bei der Problemlösung zusammenarbeiten und neue Fähigkeiten in einer vertrauten, kreativen Umgebung erwerben. Wie funktioniert es und ist es auch für kleinere Kinder geeignet?
Alice ist eine Bildungsplattform, die es Kindern und Studenten ermöglicht, in die Welt des Programmierens durch die Erstellung von 3D-Animationen, interaktiven Geschichten und einfachen Spielen einzutauchen. Sie ist sowohl für Schüler als auch für Nutzer an Hochschulen geeignet. Was bietet sie alles und wie funktioniert sie?
Die US-Regierung hat eine Untersuchung gegen das chinesische Unternehmen TP-Link eingeleitet, das 65 % des Routermarktes kontrolliert. Der Grund sind Bedenken hinsichtlich der nationalen Sicherheit, nachdem festgestellt wurde, dass ihre Geräte in Ransomware-Angriffen eingesetzt wurden.
OpenAI hat seine Weihnachtsaktion „12 Tage OpenAI“ mit der Ankündigung des revolutionären Modells o3 und seiner kleineren Version o3-mini abgeschlossen. Das neue Modell verspricht signifikante Verbesserungen im Bereich des Denkens und der Lösung komplexer Aufgaben. Vorerst wird es nur für Sicherheitsforscher verfügbar sein.