What is Nostr?
Marcel Waldvogel /
npub1pvw…qjey
2023-12-12 19:47:17
in reply to nevent1q…rfzx

Marcel Waldvogel on Nostr: Was lernen wir daraus: Gute Software durchläuft im Normalfall eine Unzahl an ...

Was lernen wir daraus:

Gute Software durchläuft im Normalfall eine Unzahl an rigorosen Tests, bevor sie auf uns User losgelassen wird. Und trotzdem schummeln sich Fehler durch diese Tests.

Bei #Chatbots wie #ChatGPT sind solche Tests kaum automatisierbar, da jedesmal etwas Anderes herauskommt. Und selbst wenn dasselbe Resultat ausgespuckt wird: Eine kleine Umformulierung der Frage kann zu einem überraschend anderen Ergebnis führen.

Diese Systeme sind kaum automatisiert testbar.
5/5
#LLM
Author Public Key
npub1pvwwfcwuspuwyjmzh5jlh3xc0y32lvyyg8n45tvsq2wm2eskvwysupqjey