Deux études séparées ont révélé que certains logiciels d’intelligence artificielle peuvent désormais apprendre une langue tous seuls – sans dictionnaire, ni d’une aide humaine.
On est bien loin du charabia laborieux de Google traduction – un programme qui a d’ailleurs été abandonné par la multinationale l’année dernière, et remplacée par un réseau neuronal très performant capable de prendre en compte des ensembles de phrases et leur contexte en utilisant l’apprentissage automatique supervisé. Toutefois récemment, deux intelligences artificielles ont récemment réussi à traduire des textes sans recourir à un dictionnaire de départ.
Deux groupes de chercheurs français et espagnols qui ont travaillé indépendamment – sans se concerter, ou même avoi connaissance du travail de l’autre – ont tous deux réussi à créer des programmes qui peuvent apprendre une langue seuls. Pour ce faire, ils se sont appuyés sur les considérables bases de données contenant des documents bilingues mises à disposition par l’ONU et du Parlement européen
La première étude a été menée par Mikel Artetxe, ingénieur informaticien à l’université du Pays Basque de San Sebastiàn en Espagne. La seconde par Guillaume Lample, un ingénieur en informatique français travaillant pour le département d’intelligence artificielle de Facebook. Toutes deux ont permis d’élaborer une méthode d’apprentissage automatique (machine learning) non supervisée relativement similaire, capable de réaliser des traductions en s’appuyant sur repose sur l’association de mots.
« Imaginez que vous donniez à une personne plein de livres en chinois et en arabe, aucun n’étant le même », explique Mikel Artetxe. « La personne doit apprendre à traduire du chinois en arabe sans aucun recoupement ». Pour ce faire, l’IA fait une cartographie de toutes les connexions qui existent dans les langues qu’elle veut traduire, un peu comme un atlas routier numérique où les mots remplaceraient les noms des villes. Puis elle apprend la représentation d’une phrase dans chaque langue avant de la traduire.
Un système vérifie ses résultats en traduisant une phrase d’une langue vers une autre puis à nouveau dans sa langue d’origine – et observe les différences pour apprendre. L’autre ajoute ou retire des mots à une phrase après l’avoir traduite afin d’observer les résultats. Pour l’instant les résultats peuvent encore être améliorés – et ne peuvent toujours pas rivaliser avec une intelligence humaine. De plus, la technique ne peut marcher que pour des langues ayant un important corpus comparatif.
This post is also available in: EN (EN)DE (DE)