Translatotron

19 mai 2019 08:35; Act: 19.05.2019 21:31 Print

Quand la traduction imite la voix et son intonation

Google a dévoilé un outil capable de traduire la parole sans transcription écrite, tout en conservant les caractéristiques de la voix de l'interlocuteur initial.

storybild

Google Traduction pourrait un jour profiter des recherches du géant du web. (20 minutes)

Sur ce sujet
Une faute?

Google a présenté dans un billet de blog le fruit d'un travail de recherche en intelligence artificielle dans le domaine de la traduction. Baptisé Translatotron, le système expérimental est capable de traduire du contenu oral directement dans une autre langue sans passer par l'étape intermédiaire de la transcription écrite de la parole. S'appuyant sur un réseau de neurones artificiels entraîné, cette «traduction directe», comme l'appelle Google, est censée gagner en rapidité.

Elle a aussi la particularité de conserver l'intonation, la cadence et la voix du locuteur initial dans les traductions vocales. Translatotron traite le son en entrée comme un spectogramme, à savoir une représentation visuelle des fréquences audio. Et grâce à un encodeur, il est en mesure de reproduire, de manière plus ou moins fidèle, les caractéristiques de la voix, comme on peut l'entendre dans les quelques exemples donnés par Google.

Les résultats de Translatotron sont pour le moment moins bons que ceux des algorithmes de traduction traditionnelle, qui repose sur une méthode «en cascade» comprenant trois étapes: transcription de la parole en texte via un système de reconnaissance vocale, traduction de la transcription écrite dans la langue cible, puis synthèse vocale de la traduction.

(man)