Mises Dev on Nostr: "Minha nossa a DeepSeek é uma revolução absurda, como eles aumentaram o desempenho ...
"Minha nossa a DeepSeek é uma revolução absurda, como eles aumentaram o desempenho brutalmente assim e reduziram o uso de memória etc etc 🤯"
Eles "apenas" truncaram as casas decimais.
Enquanto o chat GPT utiliza parâmetros como 56.684662827837388+12, o DeepSeek utiliza parâmetros como 56.68466. A grande mudança foi somente na questão do treinamento, que ontem a mesma precisão nas respostas com parâmetros que possuem muito menos casas decimais.
Então não, não mataram a Open IA e outras, somente a NVIDIA, daqui a pouco a Open IA e outras se atualizam também.. isso se for verdade os resultados divulgados né, porque o site dos caras caiu, alegadamente por ataques hacks, mas talvez seja porque não suportou a escala.
Eles "apenas" truncaram as casas decimais.
Enquanto o chat GPT utiliza parâmetros como 56.684662827837388+12, o DeepSeek utiliza parâmetros como 56.68466. A grande mudança foi somente na questão do treinamento, que ontem a mesma precisão nas respostas com parâmetros que possuem muito menos casas decimais.
Então não, não mataram a Open IA e outras, somente a NVIDIA, daqui a pouco a Open IA e outras se atualizam também.. isso se for verdade os resultados divulgados né, porque o site dos caras caiu, alegadamente por ataques hacks, mas talvez seja porque não suportou a escala.