Mozilla francophone on Nostr: 📢 Des chercheurs ont compilé 950 000 heures de données de parole open source ...
Published at
2024-10-14 09:49:08Event JSON
{
"id": "9ba3b2287f629184087307998bc3a3f0849032e0ca9ad28e5be7c54109d76752",
"pubkey": "0b98ca5e6ba5996c1170417b52fca95d3110af4642359b4faae574165bb264a9",
"created_at": 1728899348,
"kind": 1,
"tags": [
[
"t",
"commonvoice"
],
[
"proxy",
"https://mamot.fr/users/Mozilla/statuses/113305147682922300",
"activitypub"
]
],
"content": "📢 Des chercheurs ont compilé 950 000 heures de données de parole open source pour les 24 langues officielles de l’UE avec le projet MOSEL. Une initiative majeure pour l’avancement de modèles de langue IA en Europe, incluant des données de #CommonVoice. https://the-decoder.com/researchers-collect-950000-hours-of-open-source-speech-data-for-eu-languages/",
"sig": "5beca754eb50a97218137e38054571dca723827dd37fdf281a7633f1c8b9754f0a3b26cb703d7fb6562ba7c1db1b0b996af4bfb8e0f149ced927db7cf6c86903"
}