La traduction automatique change la donne en science
L’anglais, langue officielle de la science? Les outils de traduction automatique neuronale pourraient bien mettre un terme à cette dynastie.
Google Traduction soufflait ses 17 bougies en avril dernier. Comme toute personne qui arrive à l’âge adulte, le service de traduction en ligne ne cesse de gagner en maturité au fil des années. À un tel point qu’une étude récente suggère « que la traduction puisse constituer une solution à court et à long terme pour rendre la science plus résiliente, plus accessible, plus représentative à l’échelle mondiale et plus percutante au-delà du monde universitaire ». Pas convaincu.e? La citation précédente est pourtant signée par Google Traduction!
Lynne Bowker cosigne cet article. « On ne peut pas être contre un système multilingue de production de connaissances, affirme la professeure à l’École de traduction et d’interprétation de l’Université d’Ottawa. Les scientifiques pourraient ainsi faire de la recherche sans se buter à des barrières linguistiques. » L’avènement des moteurs de traduction basés sur les réseaux de neurones artificiels concrétise ce scénario de science-fiction. Cette classe d’algorithmes s’appuie sur des statistiques avancées et d’énormes quantités de données pour pondre des traductions « très performantes », juge l’experte.
Un point de vue que partage Benoît Dubreuil, commissaire à la langue française du Québec. Ce vérificateur général du français désigné par l’Assemblée nationale du Québec prépare justement un avis sur la place de la traduction automatique dans les institutions de la province qui sera publié plus tard cet automne. « Nous ne sommes plus en 2015 : ce dont on se moquait alors défie maintenant l’imagination. On a dépassé le seuil à partir duquel les traductions générées par ces outils sont acceptables, même si elles ne sont pas irréprochables », estime ce polyglotte.
Encore des limites
La nuance est importante. Les outils de traduction comme Google Traduction, mais aussi DeepL et Microsoft Translator, commettent encore des erreurs. Ces dernières sont juste plus subtiles. « Pour ce qui est de la structure grammaticale et de l’orthographe, on se rapproche de la perfection. On constate en revanche de réelles carences au chapitre de la phraséologie et de la terminologie », analyse M. Dubreuil. Un exemple parmi tant d’autres : « Indigenous people » est souvent traduit par « indigènes » plutôt que par « peuple autochtone »…
Pour Vincent Larivière, professeur à l’École de bibliothéconomie et des sciences de l’information de l’Université de Montréal, il s’agit là de limites qui commandent la plus grande prudence. « Pour les sciences humaines et sociales, le passage d’un texte à la traduction automatique peut induire des pertes de subtilités, donc de sens. Ce n’est toutefois pas forcément le cas pour des disciplines plus codifiées, comme la physique », fait valoir le titulaire de la Chaire de recherche du Canada sur les transformations de la communication savante.
Il rejoint en ce sens les propos de plusieurs intervenant.e.s entendu.e.s lors des travaux du Comité permanent de la science et de la recherche sur la recherche et la publication scientifique en français au Canada. Yves Gingras, professeur d’histoire et de sociologie des sciences à l’Université du Québec à Montréal, a par exemple affirmé devant le Comité que « [t]out traduire est irrationnel sur les plans économique et scientifique ». Selon lui, traduire systématiquement la littérature scientifique de l’anglais vers le français (ou vice-versa) serait inefficace dans un contexte de cohabitation des deux langues officielles.
Le véritable bénéfice de la traduction automatique est ailleurs, estime M. Larivière. « Dans un monde idéal, les métadonnées, les résumés et les titres des articles scientifiques seraient disponibles dans toute une série de langues de manière à augmenter leur découvrabilité », lance-t-il. Ce seuil minimum de traduction faciliterait la vie de tous les scientifiques qui maîtrisent mal l’anglais, la lingua franca dans le monde universitaire. « Le lecteur ou la lectrice pourrait ensuite choisir, à l’aide de ces outils, de traduire le texte dans la langue de son choix. On ne serait plus obligé de toujours passer par l’anglais. »
Approche raisonnée
Et ce n’est là qu’une trame narrative parmi tant d’autres. Révision de manuscrits d’étudiant.e.s aux cycles supérieurs, premier filtrage lors d’une revue de littérature, préparation de diapositives pour un colloque à l’étranger… Les emplois potentiels des outils de traduction automatique dans le quotidien des scientifiques pullulent. Tous ne s’équivalent toutefois pas. « Certains usages sont peu risqués, d’autres, beaucoup plus. Il faut être capable de porter un jugement sur le contexte d’utilisation de ces outils et leur incidence », pense M. Dubreuil.
Cette approche raisonnée implique de comprendre minimalement ce qu’il y a sous le capot de ces technologies. Par exemple, le corpus nécessaire à l’entraînement des outils de traduction automatique neuronaux n’est pas disponible dans certaines langues, faute d’un volume suffisant de publications traduites dans celles-ci. Cela a pour conséquence de rendre laborieux les passages en provenance ou à destination de ces langues. « Il y a aussi la question des paires de langues, précise Mme Bowker. Traduit-on vraiment beaucoup entre l’hindi et le français? Je ne pense pas. »
Une autre question à se poser est celle des disciplines. De manière générale, plus les domaines sont spécialisés, moins on y retrouve de ressources traduites dans d’autres langues que l’anglais. C’est pourquoi Mme Bowker croit que les traducteurs et traductrices ne sont pas près de disparaître, et ce, même si cela défie le sens commun. « Une masse critique de données de qualité est nécessaire pour rendre ces systèmes meilleurs. Et à moins d’assister à un boom de publication dans les langues nationales, cela passe par l’apport de professionnel.le.s de la traduction », tranche-t-elle.
Il faut a contrario éviter que les outils de traduction ne s’entraînent qu’à partir des productions médiocres générées par leurs vis-à-vis. Cela créerait un cercle vicieux qui minerait la performance de ces technologies et par le fait même nuirait à la promotion de la science en français. « Grâce à ces outils, il n’y a plus de raison que le français ne soit pas au moins aussi présent que l’anglais dans les milieux scientifiques au Canada, croit M. Dubreuil. Il s’agit maintenant de changer les habitudes pour tenir compte de cette nouvelle réalité. »
Postes vedettes
- Chaire de recherche du Canada, niveau 2 en génie électrique (Professeur(e))Polytechnique Québec
- Droit - Professeur(e) remplaçant(e) (droit privé)Université d'Ottawa
- Littératures - Professeur(e) (Littérature(s) d'expression française)Université de Moncton
- Medécine- Professeur.e et coordonnateur.rice du programme en santé mentaleUniversité de l’Ontario Français
- Médecine - Professeur(e) adjoint(e) (communication en sciences de la santé)Université d'Ottawa
Laisser un commentaire
Affaires universitaires fait la modération de tous les commentaires en appliquant les principes suivants. Lorsqu’ils sont approuvés, les commentaires sont généralement publiés dans un délai d’un jour ouvrable. Les commentaires particulièrement instructifs pourraient être publiés également dans une édition papier ou ailleurs.