adfichter 🖋 on Nostr: Wie gut rechnen #LargeLanguageModels? Wer zwischendurch die Textaufgabe füttert mit ...
Wie gut rechnen #LargeLanguageModels?
Wer zwischendurch die Textaufgabe füttert mit irrelevanten Zwischensätzen, bringt das Modell total aus dem Tritt: "Oliver pflückt am Freitag 44 Kiwis. Am Samstag pflückt er dann 58 Kiwis. Am Sonntag pflückt er doppelt so viele Kiwis wie am Freitag, aber fünf davon waren etwas kleiner als der Durchschnitt. Wie viele Kiwis hat Oliver?"
Das LLM ist geneigt dazu, die 5 kleineren Kiwis wegzusubstrahieren.
https://dnip.ch/2024/10/29/wie-gut-verstehen-llms-die-welt/
Wer zwischendurch die Textaufgabe füttert mit irrelevanten Zwischensätzen, bringt das Modell total aus dem Tritt: "Oliver pflückt am Freitag 44 Kiwis. Am Samstag pflückt er dann 58 Kiwis. Am Sonntag pflückt er doppelt so viele Kiwis wie am Freitag, aber fünf davon waren etwas kleiner als der Durchschnitt. Wie viele Kiwis hat Oliver?"
Das LLM ist geneigt dazu, die 5 kleineren Kiwis wegzusubstrahieren.
https://dnip.ch/2024/10/29/wie-gut-verstehen-llms-die-welt/