Passer au contenu principal
Actualités

Transcrire la Nouvelle-France quelques millions de pages à la fois

L’Université du Québec à Rimouski développe un système permettant d’archiver et de rendre disponible l’ensemble des documents liés à la colonisation de la Nouvelle-France.

par PIERRE BLAIS | 18 MAR 24

Rendre accessible la totalité des archives touchant la Nouvelle-France, voilà un défi en apparence colossal ou trop imposant peut-être pour penser s’y attaquer. Pourtant, c’est un projet qui est en cours de réalisation et qui n’effraie pas le moindrement ceux qui le chapeautent. Même s’il s’agit de manipuler et de numériser quelques millions de documents, ces tâches paraîtront « microscopiques » dans un futur pas si lointain, selon les projections du milieu. Cette percée devrait à terme permettre d’accéder librement à des tonnes d’information jusqu’ici passées inaperçues, au fond d’ouvrages regorgeant pourtant d’Histoire.

La première étape du projet Transcrire la Nouvelle-France financé à la hauteur de 425 000 dollars par le gouvernement du Québec et la Fondation canadienne pour l’innovation est de transcrire les documents existants. Toutefois, l’objectif principal est double, on parle ensuite « d’une infrastructure numérique à bâtir », énonce d’emblée Maxime Gohier, responsable du projet et professeur au Département des lettres et humanités de l’Université du Québec à Rimouski (UQAR).

Le point est important, car il faut « bâtir quelque chose de nouveau. Les initiatives du genre ailleurs sur la Terre ne sont pas nécessairement reproductibles dans notre réalité », ajoute le professeur Gohier, qui précise du coup que le développement de Transcrire la Nouvelle-France sera réalisé en code source ouvert afin que le développement puisse se poursuivre à long terme, « peut-être ailleurs ». Qui sait?

Entre-temps, l’UQAR dirige le développement de ce « dépôt central pour des thématiques bien définies », une plateforme qui deviendrait ensuite « un modèle d’outil numérique » permettant de contourner des écueils majeurs apparus avec l’arrivée du numérique et rendrait disponibles et vivantes les banques de données de la planète.

Avec l’aide de l’intelligence artificielle

Ce travail titanesque ne reposera pas uniquement sur l’humain. Mais pour que l’intelligence artificielle soit mise à profit, il faudra d’abord s’assurer de sa fiabilité. Et ensuite réviser ce qu’elle produira. « On peut avoir confiance que les choses seront bien faites », avance tout de même le professeur Gohier. « On rend souvent la donnée accessible lorsqu’elle est parfaite et finale, alors qu’ici, on aborde la donnée vivante. Il faudra être vigilant », concède-t-il, comparant l’opération globale à la réédition continue d’un ouvrage de référence, où la tâche n’est pas uniquement de produire des données qui s’inscriront dans le temps, mais également des données qui auront évolué et dont les mises à jour sont documentées.

« On ne veut pas fermer la porte à de nouvelles données, on veut que ce soit le plus ouvert possible. On pourra toujours enrichir les banques déjà existantes, et l’infrastructure servant à colliger l’information doit suivre », illustre M. Gohier. « C’est une culture à développer chez ceux qui l’utiliseront », admet-il, convaincu que le résultat de cette rigoureuse opération en vaut le coup.

Qui plus est, « Transcrire la Nouvelle-France vise à maximiser le potentiel des données. [Il n’est] pas seulement [question] d’accéder à la base [de données] les contenant, mais aussi que les données soient prêtes à être utilisées. Que nous n’ayons plus besoin de retravailler le tout à chaque fois ».

La comparaison la plus juste pour illustrer ce qu’il entend serait probablement la suivante : un livre de référence qui serait utilisé lors d’une recherche, la personne consultant le bouquin collige l’information trouvée pour ensuite produire un minilivre et lui donner un nom, un code et un résumé. Le minilivre serait par la suite rangé avec le document maître et la donnée serait classée comme « traitée ».

Loin d’être irréaliste

Même si l’objectif semble ambitieux, il s’agit d’une thématique idéale pour créer une interface comme Transcrire la Nouvelle-France. « Un carré de sable assez défini dans le temps. On veut utiliser notre thématique comme banc d’essai et constater l’enrichissement de nos données », explique le professeur Gohier, qui évalue à quelques millions de documents à traiter la tâche à accomplir. « Quelque part entre cinq et dix millions de documents », estime-t-il, sans plus de précision.

Mais alors, pourquoi affirmer que ces millions de documents couvrant la colonisation de l’Amérique par la France aux XVIe, XVIIe et XVIIIe siècles ne représentent pas un vaste défi? Puisque selon M. Gohier, des initiatives semblables ont eu cours dans des sphères de recherche canadiennes et le travail était alors encore plus colossal.

Transcrire toute la Nouvelle-France, « ce n’est pas une mince tâche par rapport aux capacités actuelles, mais avec du recul, il s’agit probablement du sujet idéal pour monter une telle infrastructure », conclut-il, visiblement galvanisé par le démarrage du projet.

COMMENTAIRES
Laisser un commentaire
University Affairs moderates all comments according to the following guidelines. If approved, comments generally appear within one business day. We may republish particularly insightful remarks in our print edition or elsewhere.

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Click to fill out a quick survey