Mark Zuckerberg, à la tête du groupe Meta. AFP

Meta poursuit ses recherches dans le domaine de l’intelligence artificielle avec un nouveau projet. Baptisé Massively Multilingual Speech (MMS), il vise à faciliter la création de modèles de reconnaissance vocale de haute qualité. Celui de la maison mère de Facebook, Instagram et WhatsApp est capable de reconnaître plus de 4000 langues parlées et de générer de l’audio par synthèse vocale (text to speech) dans plus de 1100 langues.

Comme d’autres de ses projets, Meta le rend accessible en open source sur la plateforme GitHub pour que d’autres chercheurs puissent s’en servir. «Nous mettons nos modèles et notre code en libre accès afin que d’autres membres de la communauté des chercheurs puissent s’appuyer sur notre travail et contribuer à préserver les langues du monde et à rapprocher les peuples», écrit Meta.

Lectures de la Bible comme base de données

Pour pallier le manque de données pour certaines langues, les chercheurs de Meta ont eu une approche non conventionnelle, commente le site Engadget. Ils se sont servis d’enregistrements audio d’un texte traduit à très large échelle: «Nous nous sommes tournés vers des textes religieux, tels que la Bible, qui ont été traduits dans de nombreuses langues différentes et dont les traductions ont été largement étudiées dans le cadre de la recherche sur la traduction linguistique basée sur le texte», expliquent-ils.

«Nous avons créé un ensemble de données de lectures du Nouveau Testament dans plus de 1100 langues, ce qui a fourni en moyenne 32 heures de données par langues. En prenant en compte les enregistrements non étiquetés de diverses autres lectures religieuses chrétiennes, nous avons augmenté le nombre de langues disponibles à plus de 4000», ajoutent-ils. Et d’assurer que bien que ces données proviennent du domaine religieux, les analyses de Meta ont montré que le modèle n’est pas conditionné et est capable de générer toutes sortes de textes.

