idea: adversarial reinforcement learning of LLMs via gaslighting

npub1xts…kk5s

2025-03-14 11:09:24

idea: adversarial reinforcement learning of LLMs via gaslighting

Author Public Key

npub1xtscya34g58tk0z605fvr788k263gsu6cy9x0mhnm87echrgufzsevkk5s

Seen on

wss://nostr.mom wss://relay.nostr.band wss://relay.primal.net

Show more details