What is Nostr?
Andreas Wagner /
npub1a8j…0rts
2025-03-06 11:54:14

Andreas Wagner on Nostr: Eine grundlegende technische Differenz, die m.E. jede wissenschaftspolitische LLM ...

Eine grundlegende technische Differenz, die m.E. jede wissenschaftspolitische LLM Strategie berücksichten muss:

Generative (autoregressive) Modelle (die würden wir z.B. für Code Generation brauchen) sind etwas anderes als autoencoding Modelle (für z.B. Klassifikation) oder seq2seq Modelle (für z.B. (multimodale) Übersetzungen). Die autoencoders müssten im Vergleich zu GPT, Claude & Co. - bei gleicher Skalierungsstufe wohlgemerkt - Klassifikation und Informationsextraktion *viel besser* beherrschen, kein ausbeuterisches RLHF benötigen und nur wenig für Halluzinationen anfällig sein. Sie sind halt von den kommerziellen Anbietern nicht auf dieselbe Stufe hochskaliert worden wie die "Chat" Modelle.

Das müssten wir in der Wissenschaft vielleicht selber machen, aber das hätte ja auch Vorteile.

#DHd2025 #LLM
Author Public Key
npub1a8jusng5cwh32kvdgge7neqfdq27x8clpqaxplm42d9fe0vfd72sdd0rts