"Führende KI-Programme, darunter GPT-4o und Claude 3.5 Sonnet, konnten

2024-11-25 08:06:29

"Führende KI-Programme, darunter GPT-4o und Claude 3.5 Sonnet, konnten – selbst mit Zugriff auf Programmierschnittstellen, um ihre Ergebnisse zu testen – weniger als zwei Prozent einer anspruchsvollen Mathematikaufgabensammlung lösen."

https://www.spektrum.de/news/geheime-mathematikaufgaben-blamieren-ki-modelle/2243678

Author Public Key

npub129m2t7tsu2a5kr8n0gspkrjqqs52qehepfm9ptskcyzkwp2jg49stm8mmj

Show more details

Markus Feilner :verified: on Nostr: "Führende KI-Programme, darunter GPT-4o und Claude 3.5 Sonnet, konnten – selbst ...