Imagine France
08H29 - jeudi 5 septembre 2019

Lost in translation. La chronique innovative de Philippe Boyer

 

Les récentes erreurs d’interprétariat lors de la rencontre qui s’est tenue entre les Présidents français et russe au fort de Brégançon le 19 août dernier ont confirmé la faillibilité humaine. Les progrès de l’intelligence artificielle sur ces sujets donnent un avantage à la technologie.

Le fait est passé presque inaperçu… En plein cœur de l’été, la France et la Russie ont frôlé l’incident diplomatique. Pourtant, tout avait si bien commencé en ce 19 août au fort de Brégançon. Un bouquet de fleurs offert à Brigitte Macron par l’hôte du Kremlin, quelques autres compliments réciproques – le teint hâlé du couple présidentiel – et puis, bien sûr, au menu de ce rapprochement bilatéral, une multitude de sujets d’actualité : de la Syrie à l’Ukraine, de l’urgence climatique aux échanges économiques entre les deux pays. Ce ciel sans nuage s’obscurcit soudain quand, à l’occasion des questions réservées à la presse, des journalistes se risquèrent à poser les questions qui fâchent. Rien de plus normal sauf que, cas rarissime, ce fut la traduction simultanée des propos de chaque président qui s’avéra catastrophique. Bien sûr, media russes et français s’en firent l’écho. Certains même dénonçant au passage une « manipulation grossière » de Moscou [1].

On savait l’exercice de la traduction être un art délicat mais on avait oublié qu’il pouvait également se transformer en un acte politique. Cet imbroglio qui mit les réseaux sociaux en ébullition trouva son origine lorsque l’interprète altéra les propos du président russe sur les gilets jaunes. Si Vladimir Poutine prononça bien « 11 personnes tuées et 2 500 blessées, dont 2 000 policiers », l’interprète officielle russe se contenta d’une vague traduction sur le bilan de la mobilisation des gilets jaunes sans même citer les chiffres dans sa traduction [2]. Impossible de savoir si l’erreur a été sciemment commise. Pronostiquons que si les services officiels des deux présidents s’étaient préalablement entendus pour faire confiance à l’intelligence artificielle, cette polémique ne se serait peut-être jamais développée.

 

La machine dépasse l’humain 

En effet, les traductions automatiques basées sur l’intelligence artificielle n’ont presque plus rien à envier au travail de traduction effectué par l’humain. La qualité du rendu, surtout pour les sujets techniques, s’avère impressionnante de précision et de fidélité aux propos écrits ou prononcés. De tels résultats sont bien sûr à mettre au crédit des dernières avancées en matière de « deep learning », ces méthodes d’intelligence artificielle assise sur l’apprentissage automatique qui modélisent un grand nombre de données grâce à des architectures réseaux très complexes. Issues de travaux en grande partie menés par les GAFA (Facebook réalise plus de 4 milliards de traduction chaque jour), ces techniques – notamment celle baptisée « NMT [3] » pour « Neural Machine Translation » : traduction automatique neuronale – ont permis de faire un bond de géant sur la qualité des transcriptions.

Le temps où l’on hésitait à utiliser Google Trad en raison de ses traductions plus approximatives est sur le point – ou déjà –  révolu. Au mois de mars 2018, la machine réussit même à égaler un humain en traduisant de manière parfaite des coupures de journaux chinois vers l’anglais [4]. Une véritable prouesse qui redonna espoir à tous ceux qui se lamentaient d’être « mauvais » en langues étrangères.

 

Word embedding

Pour décrypter de tels progrès, il faut se plonger dans quelques explications qui rendent compréhensibles ces récents progrès sur ces sujets de traduction. Il y a d’abord l’arrivée de microprocesseurs surpuissants. Pour associer des millions de combinaisons de mots via les « neurones artificiels » qui transportent des signaux, il faut associer puissance et vitesse d’exécution.

Il y a ensuite le développement de techniques sans lesquelles ces traductions simultanées ne pourraient avoir lieu. En l’occurrence, celles de « word embedding » ou « plongement lexical » en français) en tant que méthode d’apprentissage d’une représentation de mots. Cette technique permet de représenter chaque mot d’un dictionnaire par un vecteur de nombres en prenant soin de disposer l’ensemble de ces mots et expressions de manière plus ou moins proche en fonction de leurs sens. En clair, il s’agit de faire « avaler » aux systèmes d’immenses corpus de textes dans leurs langues d’origineen y incluant différentes traductions. »

Reste ensuite à les recomposer en fonction de la phrase à traduire. Si cette technique s’avère performante pour les textes rédigés, un niveau de difficulté supplémentaire survient lorsqu’il s’agit de traduction automatique d’une conversation. Là encore, la technologie avance très rapidement : le chinois Baidu a annoncé il y a quelques mois un système de traduction capable de prévoir la fin de phrases des interlocuteurs [5].

L’espoir que nous puissions arriver à un dispositif qui égale, voire dépasse, la traduction humaine reste encore un rêve. Si les systèmes qui équipent nos smartphones fonctionnent déjà pour la vie quotidienne ou les voyages – Google Trad s’avère très performant pour demander son chemin dans une autre langue –il faudra attendre encore un peu pour que les traducteurs officiels des successeurs de Vladimir Poutine et d’Emmanuel Macron se passent de leurs interprètes officiels, quitte à ce que ces derniers se « perdent dans leurs traductions »… ou que l’un des deux rempile pour vingt ans de pouvoir…

 

Philippe BOYER

Directeur de l’innovation d’un grand groupe, chroniqueur Opinion Internationale.

Son dernier livre : «God save the tweet» par Philippe Boyer, roman, éditions Kawa, mars 2019.

 


[1]http://www.leparisien.fr/international/poutine-et-macron-evoquant-les-gilets-jaunes-comment-le-kremlin-a-manipule-la-traduction-21-08-2019-8137086.php

[2]https://www.liberation.fr/checknews/2019/08/20/rencontre-a-bregancon-l-interprete-a-t-elle-altere-des-propos-de-poutine-sur-les-gilets-jaunes_1746174

[3]https://en.wikipedia.org/wiki/Neural_machine_translation

[4]https://blogs.microsoft.com/ai/chinese-to-english-translator-milestone/

[5]https://medium.com/syncedreview/baidu-announces-breakthrough-in-simultaneous-translation-2324aa4aa5c7