What is Nostr?
Markus Feilner :verified: /
npub129m…8mmj
2024-11-25 08:06:29

Markus Feilner :verified: on Nostr: "Führende KI-Programme, darunter GPT-4o und Claude 3.5 Sonnet, konnten – selbst ...

"Führende KI-Programme, darunter GPT-4o und Claude 3.5 Sonnet, konnten – selbst mit Zugriff auf Programmierschnittstellen, um ihre Ergebnisse zu testen – weniger als zwei Prozent einer anspruchsvollen Mathematikaufgabensammlung lösen."

https://www.spektrum.de/news/geheime-mathematikaufgaben-blamieren-ki-modelle/2243678
Author Public Key
npub129m2t7tsu2a5kr8n0gspkrjqqs52qehepfm9ptskcyzkwp2jg49stm8mmj