What is Nostr?
ごま団子 /
npub1let…7u2d
2024-01-17 19:30:29

ごま団子 on Nostr: ...

特殊詐欺犯罪者たちに素晴らしい朗報だ(笑)、という冗談はさておいて、「天下のNTT」がどれほどのものを作ったのか興味津々だ。

記事に曰く、
《新技術は、数分~10分程度の音声データを機械に読み込ませて声を合成する。性別や年代による声色の特徴を高いレベルで再現するだけでなく、同じ言葉でも「平静」や「喜び」、「悲しみ」など感情に変化をつけて発声できるという。数秒の音声データだけでも本人に似た声を再現できる簡易版の技術も開発した。》

OCRした蔵書も千冊単位となると目で読むだけでは追いつかない。此の技術が本当に使い物になるのなら「耳での読書」が捗る…。

もちろん医療・福祉といった社会的に意義ある分野で有効に活用出来れば素晴らしいことだが、此の一報に個人的興味の方が勝る。続報を待ちたい。

—-
生成AIで音声を忠実再現 NTTが開発、話し方も:東京新聞 TOKYO Web https://www.tokyo-np.co.jp/article/303422
Author Public Key
npub1let3rzfcaumd65n8k4nnc264qdx8n4sglw2g9lpddkhr9w3q3g4qp37u2d