au sommaire
Traduire le langage courant en divers idiomes est un exercice dans lequel l'intelligence artificielle (IA) est de plus en plus performante. Il existe aujourd'hui plusieurs outils de traduction automatique en ligne grâce auxquels on parvient à saisir le sens d'un texte avec une relative clarté. Toutefois, demander à une IA de traduire un texte scientifique ou technique avec la fidélité et la rigueur nécessaires est encore très compliqué. « Était » encore très compliqué faut-il plutôt dire puisqu'une belle avancée vient d'être accomplie dans ce domaine, et qui plus est par une entreprise française !
Une intelligence artificielle a réalisé la traduction intégrale en français (depuis l'anglais) du livre « Deep Learning » en 12 heures à peine et avec une fidélité jusqu'ici jamais atteinte. Cet ouvrage de huit cents pages coécrit par Ian Goodfellow, Yoshua Bengio et Aaron Courvill, est une référence mondiale consacrée à l’apprentissage profond qui n'avait encore jamais été traduit dans la langue de Molière. Une très bonne nouvelle donc pour les chercheurs et étudiants francophones et pour tous ceux qui veulent s'intéresser de près à l'intelligence artificielle.
« Nous voulions amener Deep Learning en France et, au passage, défendre l'école française de mathématiques et une pensée spécifique dans ce domaine », explique pour Futura Alexandre Stora, membre de l'équipe dirigeante de Quantmetry. Cette jeune pousse hexagonale est spécialisée dans le conseil en intelligence artificielle pour les entreprises. Mais pourquoi ne pas avoir tout simplement fait appel à des traducteurs spécialisés ? « Trop long et trop cher », nous répond notre interlocuteur qui évoque un an de travail et un budget avoisinant les 150.000 euros.
La traduction française de Deep Learning, « L’apprentissage profond », sera disponible dans les librairies à partir du 18 octobre. © Massot Editions, Quantmetry
Un dictionnaire de 200 termes spécifiques
Pour mener à bien cet ambitieux projet, Quantmetry s'est allié à Deepl, service en ligne de traduction automatique développé par les créateurs de Linguee. Lancé en août 2017, Deepl est d'ores et déjà considéré comme le meilleur de sa catégorie. « La performance de Deepl tient à son corpus très bien traduit », souligne Alexandre Stora. Mais cela était encore insuffisant pour pouvoir s'attaquer à la complexité du texte de Deep Learning. Et surtout, il fallait également pouvoir traduire les formules mathématiques, les tableaux et autres graphiques qui ponctuent le texte.
« Nous sommes partis de l'API Deepl à laquelle nous avons ajouté des outils spécialement développés pour la traduction des fiches et graphismes », précise le responsable de Quantmetry. L'équipe a également créé un dictionnaire de deux cents mots spécifiques afin de garantir une constance et une cohérence dans la traduction des termes mathématiques.
Trois mois de développement ont été nécessaires pour préparer l'IA à ce défi. Mais une fois l'outil prêt, il n'a fallu que douze heures à la machine pour accomplir la traduction. Une équipe de chercheurs de l'ENSAI, l'Inria et du CNRS a effectué le travail de relecture et a constaté la très grande qualité de la traduction initiale. Selon Alexandre Stora, il n'y a eu que peu de reprises au niveau du texte lui-même, plutôt des « ajustements à la marge », notamment sur la ponctuation ou bien pour « élargir le contexte ». Toutefois, dans son communiqué, Quantmetry prend soin de préciser que « l'IA est performante pour traduire un contenu technique, mais que le rôle du traducteur humain reste essentiel, à plus forte raison concernant les ouvrages artistiques ou littéraires ».
Un outil publié en open source
Cette IA peut-elle pour autant être considérée comme une traductrice hors pair, capable de s'attaquer à n'importe quel livre ? « Elle est parfaite pour les contenus scientifiques mais elle ne saurait pas retranscrire la plume, ni le stylestyle d'un auteur », reconnaît notre interlocuteur. Il n'empêche que la performance est déjà impressionnante. Et surtout, elle ouvre des possibilités très prometteuses pour la communauté des chercheurs français.
En effet, Quantmetry a prévu de publier en open source le logiciel créé pour convertir le travail des algorithmes au format LaTexLaTex (outil d'écriture de documents scientifiques très populaire dans le milieu de la recherche). L'objectif est d'offrir aux chercheurs en sciences, mais aussi aux historienshistoriens, l'opportunité d'adapter l'outil pour réaliser rapidement et à moindre coût des traductions de textes pointus dont la faible diffusiondiffusion ne justifie pas d'engager des traducteurs humains. En revanche, l'accès à l'API Deepl restera payant.
Quant à la traduction française de Deep Learning, « L’apprentissage profond », elle sera commercialisée à partir du 18 octobre au prix de 69 euros dans toutes les librairies, à la Fnac et sur AmazonAmazon.
Ce qu’il faut
retenir
- La traduction automatique n'était, jusqu'à présent, pas encore assez performante pour être utilisée sur des textes scientifiques ou techniques complexes.
- La société française Quantmetry, associée au service de traduction Deepl, a formé une intelligence artificielle pour réaliser la traduction d'un ouvrage de référence sur l'apprentissage profond.