Descentralismo on Nostr: ## IAs que modificam a voz em tempo real Mas por que usar IA? Porque as IAs geram uma ...
## IAs que modificam a voz em tempo real
Mas por que usar IA?
Porque as IAs geram uma nova voz em cima da original ao invés de só alterar, entregando muito mais segurança de não ser identificado em ligações, e, chamadas ou gravações de vídeo.
Um bom exemplo de um serviço de voz em tempo real que não é de IA, é o EaseUS, que assim como vários outros apps como o Loquendo, só aplicam efeitos e não geram de fato uma nova voz, sendo mais usado para memes, pegadinhas e jogos.
https://song.link/y/aEBWB3YanGU
O RVC Project é uma boa demonstração de um gerador de voz com IA, sendo inclusive de código aberto e em tempo real. Ele gera o tom e as nuances da voz para aproximar de personagens de anime, e também youtubers e streamers.
Olhe a descrição do vídeo original para ver outros links úteis:
https://song.link/y/zkaBK5erB2c
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs%2Fen%2FREADME.en.md
Já o voice.ai é outro gerador, que embora centralizado, modifica o tom e as nuances, aproximando bastante a voz de ícones de diversas áreas como atores, apresentadores e até personagens de desenhos animados, porém tem limitações de uso e apresenta algumas falhas com cortes na fala na versão em tempo real.
https://song.link/y/AdbT6Wjcq3U
Já o Sanas, também centralizado, tanto retira o sotaque como muda o tom, tornando a voz mais clara e agradável para um maior número de pessoas. Ele foi pensado especialmente para atendentes de telemarketing filipinos e indianos, que falam ao falarem em inglês costumam sofrer mais dificuldade em serem entendidos, mas as demonstrações só são vistas em inglês.
https://song.link/y/kNjOEqhwBRw
Mas por que usar IA?
Porque as IAs geram uma nova voz em cima da original ao invés de só alterar, entregando muito mais segurança de não ser identificado em ligações, e, chamadas ou gravações de vídeo.
Um bom exemplo de um serviço de voz em tempo real que não é de IA, é o EaseUS, que assim como vários outros apps como o Loquendo, só aplicam efeitos e não geram de fato uma nova voz, sendo mais usado para memes, pegadinhas e jogos.
https://song.link/y/aEBWB3YanGU
O RVC Project é uma boa demonstração de um gerador de voz com IA, sendo inclusive de código aberto e em tempo real. Ele gera o tom e as nuances da voz para aproximar de personagens de anime, e também youtubers e streamers.
Olhe a descrição do vídeo original para ver outros links úteis:
https://song.link/y/zkaBK5erB2c
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs%2Fen%2FREADME.en.md
Já o voice.ai é outro gerador, que embora centralizado, modifica o tom e as nuances, aproximando bastante a voz de ícones de diversas áreas como atores, apresentadores e até personagens de desenhos animados, porém tem limitações de uso e apresenta algumas falhas com cortes na fala na versão em tempo real.
https://song.link/y/AdbT6Wjcq3U
Já o Sanas, também centralizado, tanto retira o sotaque como muda o tom, tornando a voz mais clara e agradável para um maior número de pessoas. Ele foi pensado especialmente para atendentes de telemarketing filipinos e indianos, que falam ao falarem em inglês costumam sofrer mais dificuldade em serem entendidos, mas as demonstrações só são vistas em inglês.
https://song.link/y/kNjOEqhwBRw