China lançou DeepSeek IA, 670G parametros (o maior ate agora), opensource (code, ...

China lançou DeepSeek IA, 670G parametros (o maior ate agora), opensource (code, não só training data), e performance comparavel ao melhor da OpenAI americana, que é fechado.

https://www.alilybit.com/p/what-chinas-deepseek-ai-really-means

Obvio, a China subsidiou o treinamento tentando dominar o mercado, e abrir a IA quebra o modelo de negocio dos americanos. Isso é o mais importante, permtir usar IA sem pagar pedágio pras empresas americanas. Mesmo que seja inferior.

Fico curioso:

* o modelo novo e maior incorpora melhorias recentes na arquitetura e teoria, pra permtir treinar com menos GPU como dizem, ou apenas jogaram mais $$$ e GPU nos mesmos modelos anteriores? i.e., é esperteza ou força bruta? Se o codigo de treinamento for mesmo livre, saberemos logo.

* Porque um modelo maior e mais moderno não é MELHOR nos benchmarks do que os americanos?

Por um lado, ao inves de modelo censurado pelo deep state, teremos modelos censurados pelo PCC! Por outro lado, como o Andrew do Gab diz, se for mesmo opensource, pode-se retirar todos os filtros externos de censura. Sim, dá pra retreinar, mas não 'esquecerá' completamente o corpus de treinamento que o PCC escolheu, talvez ele esteja otimista demais.

https://news.gab.com/2025/01/deepseek-a-sputnik-moment-for-ai/

LuisSP on Nostr: China lançou DeepSeek IA, 670G parametros (o maior ate agora), opensource (code, ...