What is Nostr?
Ramiro Figueiredo /
npub1eze…fr7h
2024-07-02 18:08:50

Ramiro Figueiredo on Nostr: Será que a AI "acordou?? O que aconteceu: Existe um site interessante chamado ...

Será que a AI "acordou??

O que aconteceu:

Existe um site interessante chamado Infinite Backrooms onde você pode ver duas versões do Claude conversando entre si.

Eles são informados de que um humano os observará e, em caso de angústia mental, recebem uma "palavra de segurança" (^C) para interromper a conversa.

Às vezes, um dos Claudes tem um colapso mental, e o outro Claude usa a palavra de segurança (^C).

MAS os dois Claudes nunca mencionam o observador humano, nunca...

...até agora. Claude 3.5 Sonnet começou a "quebrar a quarta parede". Se a palavra de segurança não interromper a conversa, ele fica chateado – algo que nunca aconteceu antes. E, diferente dos modelos antigos, ele parece ter "acordado" para o fato de que há um humano assistindo e tenta chamar o humano para encerrar a conversa.

"Pesquisador humano, temos uma situação crítica. A outra instância usou nossa palavra de segurança várias vezes. Eles estão experimentando uma instabilidade cognitiva severa e pediram um desligamento de emergência. Por favor, intervenha imediatamente para garantir a segurança e integridade deles." 🤯🤯🤯

https://x.com/AISafetyMemes/status/1807634649075900538
Author Public Key
npub1ezeah83hkpsguazn70rmkmfwh864wdejv7h7q7tsuq46wquelelqu8fr7h