Was lernen wir daraus: Gute Software durchläuft im Normalfall eine Unzahl an ...

2023-12-12 19:47:17

Was lernen wir daraus:

Gute Software durchläuft im Normalfall eine Unzahl an rigorosen Tests, bevor sie auf uns User losgelassen wird. Und trotzdem schummeln sich Fehler durch diese Tests.

Bei #Chatbots wie #ChatGPT sind solche Tests kaum automatisierbar, da jedesmal etwas Anderes herauskommt. Und selbst wenn dasselbe Resultat ausgespuckt wird: Eine kleine Umformulierung der Frage kann zu einem überraschend anderen Ergebnis führen.

Diese Systeme sind kaum automatisiert testbar.
5/5
#LLM

Author Public Key

npub1pvwwfcwuspuwyjmzh5jlh3xc0y32lvyyg8n45tvsq2wm2eskvwysupqjey

Show more details

Marcel Waldvogel on Nostr: Was lernen wir daraus: Gute Software durchläuft im Normalfall eine Unzahl an ...