L’intelligence artificielle au service de l’histoire universelle
Une équipe internationale d’universitaires s’intéresse à un ouvrage historique d’une envergure titanesque.
Au XIIIe siècle, un monarque ambitieux, le roi Alphonse X de Castille, a commandé la rédaction d’une histoire universelle titanesque, qui débuterait aux origines du monde selon la Bible pour se terminer à son règne. Il en résultera la Grande e general estoria, qui entrecroise différentes figures chrétiennes, juives et musulmanes, interprétations bibliques apocryphes et histoires attribuables aux traditions mythologiques et historiographiques classiques du monde grec et latin. Totalisant 6 000 pages, elle est la plus imposante histoire universelle rédigée en Europe médiévale – et l’une des moins connues.
Plus de 700 ans plus tard, Francisco Peña, professeur à la Faculté des études créatives et critiques sur le campus Okanagan de l’Université de la Colombie-Britannique, est tombé sur la Grande e general estoria en faisant des recherches sur des figures bibliques pour un livre. « J’ai compris à quel point elle est originale et différente. Ce qui est très intéressant, c’est qu’elle recense toutes sortes de sources dont j’ignorais qu’elles avaient circulé en Espagne médiévale. Je pouvais faire le lien avec des sources connues, et des manières d’écrire qui m’étaient familières. » Il estimait que l’ouvrage méritait une étude approfondie, « mais il est énorme ».
L’idée avait néanmoins germé, et M. Peña a formé une petite équipe de six universitaires pour s’attaquer à cet imposant projet. En 2016, l’équipe a reçu une subvention de développement Savoir du Conseil de recherches en sciences humaines (CRSH) pour établir la faisabilité du projet. Depuis, l’équipe, profitant de subventions subséquentes, n’a cessé de croître. Elle est maintenant composée de près de 60 universitaires et praticiennes et praticiens travaillant dans 18 organismes partenaires et 33 établissements dans une dizaine de pays, dont le Canada, la Colombie, l’Égypte, le Portugal, l’Espagne, la Tunisie, le Royaume-Uni et les États-Unis. M. Peña est chercheur principal et codirecteur du projet, aux côtés de Katie Brown de l’Université d’Exeter en Angleterre et de Francisco Gago-Jover du Collège de la Sainte-Croix à Worcester, dans le Massachusetts aux États-Unis. En 2025, La confluence des cultures religieuses dans l’historiographie médiévale : un projet numérique de sciences humaines a reçu une subvention de partenariat de 2,1 millions de dollars du CRSH.
Un transfert de savoir
La Grande e general estoria est rédigée en espagnol médiéval, à une époque où les textes européens similaires s’écrivaient majoritairement en latin. Les gens lettrés ayant contribué à l’œuvre ont donc eu à traduire et à adapter diverses sources religieuses et classiques; la plupart étaient en latin, mais certaines étaient rédigées en français et en arabe. « J’ai eu l’idée d’étudier ce texte parce qu’il s’agit de la plus importante histoire universelle écrite en Europe au Moyen âge, et parce qu’il témoigne d’un phénomène qu’on observait à l’époque, soit le transfert de savoir de l’Orient à l’Occident, explique M. Peña. Nous avons donc ce texte, qui rassemble moult sources différentes, dont bon nombre ont disparu partiellement ou entièrement. Il a également été produit à une époque charnière pour le transfert des connaissances, non seulement en sciences humaines, mais aussi en sciences pures. »

Des traductions et des études du texte ont déjà été réalisées, mais l’équipe internationale de recherche entreprend une tâche encore plus colossale. « Je voulais mettre sur pied un projet qui aborde les sciences humaines d’une manière différente, plus collaborative et interdisciplinaire », explique M. Peña. Le projet rassemble des chercheuses et chercheurs de diverses disciplines, y compris les langues, l’histoire, l’analyse textuelle, l’archivistique, la philologie et les technologies numériques. « Au-delà des mirages de l’ego, ce genre de projet, qui réunit des groupes de personnes, nous montre à quel point on ne sait pas grand-chose, et on doit interagir avec les autres pour progresser. C’est la beauté de la chose. »
L’équipe collabore pour créer sa propre édition critique annotée, afin de favoriser une compréhension plus approfondie du sens du texte, fidèle à l’intention des personnes qui l’ont écrit. « Nous étudions l’ouvrage et nous créons toutes sortes d’outils pour le situer par rapport à d’autres sources », explique M. Peña, notamment des traductions, des glossaires, des renseignements bibliographiques et d’autres annotations. L’équipe souhaite faire le lien avec d’autres textes médiévaux, y compris certains « qui n’ont pas encore été édités, ou auxquels nous n’avons pas accès – non seulement en espagnol, mais aussi en latin, en arabe et probablement en caractères cyrilliques ou en grec ».
Les éditions précédentes étaient présentées sur support papier, ce qui limitait l’espace disponible pour l’ajout d’explications et d’annotations. Ce projet prévoit la création d’une version numérique à l’aide d’une plateforme appelée Colabora, laquelle a été mise sur pied par M. Peña et ses collègues. Elle permet à l’équipe de travailler simultanément et collaborativement, peu importe la distance et les frontières disciplinaires, pour transcrire, numériser, traduire et annoter les 6 000 pages du texte original à l’aide d’un éventail d’outils numériques de sciences humaines – dont l’intelligence artificielle (IA).
Élargir la recherche historique à l’aide de l’IA
Les spécialistes de l’histoire utilisent depuis longtemps des outils numériques et statistiques, mais ces dernières années, l’IA a changé la donne. William J. Turkel, professeur d’histoire à l’Université Western Ontario, figure parmi les premières personnes à qui l’établissement a accordé une bourse pour l’enseignement de l’IA générative en 2025. « Il y a quelques centaines d’années, une personne aurait pu consacrer sa vie à rédiger une concordance des œuvres de Shakespeare, raconte M. Turkel. Elle les aurait passées au peigne fin, notant chaque mot utilisé par l’auteur ainsi que le contexte, et aurait élaboré une liste alphabétique de ces entrées. Ce genre d’outil était tellement utile que des gens passaient littéralement leur vie à en créer. » De nos jours, « une personne qui ne connaît rien à la programmation pourrait utiliser ChatGPT et, en lui donnant les indications nécessaires, créer un concordancier en quelques minutes ».
M. Turkel observe un accueil mitigé de l’IA chez ses collègues. « Beaucoup de mes collègues semblent réellement espérer qu’elle disparaîtra d’elle-même. » D’autres choisissent de mettre cette technologie à l’essai. « On a découvert qu’elle pouvait faire des choses relevant presque de la science-fiction, comme transcrire des manuscrits du XVIIIe siècle avec plus d’exactitude que nos meilleurs modèles d’il y a quelques années […] Et il y a tant de possibilités qui nous échappent; nous pourrions faire encore plus. Par ailleurs, le fait est que notre compréhension du passé, et les preuves dont nous disposons pour comprendre le passé, changent et continueront de changer dans un avenir rapproché. »
M. Peña et l’équipe de projet, cherchant à mieux appréhender l’histoire par l’étude de la Grande e general estoria, tentent de mettre l’IA à profit pour analyser cette énorme quantité de textes datant de l’ère médiévale. L’IA peut notamment les aider à transcrire les pages manuscrites.
La transcription des textes médiévaux peut d’ailleurs s’avérer exceptionnellement fastidieuse. Outre leur calligraphie recherchée, ces textes étaient souvent écrits en bloc, sans paragraphes et parfois même sans espaces entre les mots. Des abréviations et des caractères spéciaux étaient souvent utilisés, et l’orthographe n’était généralement pas normalisée. La transcription d’une seule page pourrait prendre à un être humain quelques jours, mais « quand on entraîne l’IA avec un texte médiéval donné, elle le déchiffre très rapidement », explique M. Peña. Une personne membre de l’équipe, qui avait déjà traduit des textes médiévaux avec l’aide de l’IA, met la technologie à l’essai sur un manuscrit de la Grande e general estoria.

L’équipe s’emploie aussi à utiliser l’IA pour identifier les différentes sources et voix imbriquées dans le texte. « Nous savons que ces 6 000 pages n’ont pas été écrites par le roi. C’est certain. Il était trop occupé à se battre avec sa propre famille et avec bien d’autres rois », explique M. Peña. Alphonse X a commandé l’ouvrage, qu’une équipe diversifiée de personnes érudites de confession chrétienne, juive et musulmane ont rédigé – s’appuyant, à leur tour, sur un éventail encore plus vaste de sources. Il en résulte un texte polyphonique, et parfois contradictoire.
« C’est fascinant. Dans un passage, le peuple musulman est présenté de manière très péjorative, tandis qu’un autre en brosse un portrait merveilleux », raconte M. Peña. La Grande e general estoria intègre ainsi un éventail de perspectives et de points de vue véhiculés par diverses plumes. « Il est primordial de distinguer les diverses voix, de savoir d’où elles provenaient et à qui elles appartenaient – et d’ainsi illustrer la complexité de ce travail et de la réalité en tant que telle. »
Pour identifier chaque plume, il ne suffit pas d’analyser les différentes calligraphies. Au Moyen âge, « la personne qui écrit n’est pas vraiment celle qui rédige. Le texte était souvent dicté. Impossible donc d’associer la voix à l’écriture. Il faut la reconnaître par son style, explique M. Peña. Par exemple, la syntaxe et le vocabulaire choisi peuvent évoquer un endroit particulier de la péninsule Ibérique. »
Pour analyser ces différences stylistiques, les universitaires utilisent un programme s’appuyant sur la stylométrie, soit l’utilisation de l’analyse statistique pour identifier l’autrice ou l’auteur d’un texte. Or, avec la Grande e generalestoria, le processus est « complexe », nuance M. Peña. Il semble que dans certains cas, la paternité de l’œuvre change d’une page à l’autre, et parfois même dans un même texte. « Il nous faudra entraîner ce programme pour l’analyse des différents styles, ce à quoi l’IA pourrait être utile. »
Un projet pilote mise sur l’utilisation d’un transformateur génératif préentraîné personnalisé pour comparer la Grande e general estoria à des sources antérieures classiques, chrétiennes bibliques, latines, arabes, hébraïques et populaires. Conçu pour repérer les similitudes textuelles et thématiques, il pourrait faciliter l’identification des sources originales, et peut-être permettre de distinguer les différentes plumes. L’outil est mis à l’essai avec une application axée sur l’aide bibliographique, qui se sert de l’IA ainsi que de bibliographies choisies et de résultats du projet pour aider les universitaires à repérer les études et les écrits liés, à résumer les idées clés et à faire plus facilement des recherches dans la Grande e general estoria. « Grâce à tout cela, nous pourrons un jour commencer à en distinguer les différentes parties, explique M. Peña. Par exemple, si en faisant des recherches je voulais savoir ce qui a été écrit par une personne copiste ou collaboratrice en particulier, je pourrai le trouver dans cette plateforme. »
Adoption d’une approche critique
S’il est attendu que l’IA accélère certains aspects du projet et en permette d’autres, le travail repose néanmoins sur le jugement et l’expertise d’êtres humains. « Nous devons toujours tout passer en revue », explique M. Peña, ajoutant que le projet a mis au jour certaines faiblesses de l’intelligence artificielle, notamment en traduction.
« Nous devons créer la voix qui transmettra ce texte, une voix qui a connaissance du texte. Il faut évoquer cette personnalité tout en passant de l’espagnol médiéval à une langue moderne, et l’intelligence artificielle n’est pas en mesure de le faire à l’heure actuelle. » Une équipe du projet, formée de chercheuses et chercheurs et de stagiaires, travaille à traduire collaborativement le texte en anglais et en français modernes. L’IA devrait ensuite faciliter la traduction de ces traductions en d’autres langues modernes.
L’IA étant de plus en plus répandue, il devient plus difficile de décider quand l’utiliser ou non. L.K. Bertram, professeure d’histoire à l’Université de Toronto, s’intéresse à la désinformation sur les médias sociaux et au virage de l’IA. En 2020, Mme Bertram a créé une classe ouverte sur Instagram à propos du travail du sexe et de son histoire. « J’ai toujours pensé que les sociétés ne pouvaient pas prendre de bonnes décisions sans disposer d’information exacte sur le passé; l’histoire du travail du sexe et le travail du sexe en tant que tel font l’objet de beaucoup de désinformation », explique-t-elle. Elle a diffusé de brèves leçons, qui « ont connu un succès rapide, c’était formidable. » Mais en raison du contenu qu’elle partageait, ses cours ont attiré l’attention des algorithmes de la plateforme, « comme s’il s’agissait d’un compte sur la prostitution. » Instagram a donc fermé son compte. « En ayant été moi-même la cible des outils algorithmiques, j’ai été poussée à me poser plus de questions », relate Mme Bertram.

Qu’il s’agisse de l’IA algorithmique ou de l’IA générative, plus controversée encore, Mme Bertram estime qu’il y a lieu de remettre en question le terme lui-même. « Comme Kate Crawford le soutient, l’intelligence artificielle n’est ni artificielle, ni intelligente. Ces outils peuvent faire de grandes choses, tout comme commettre des horreurs. Tout dépend de la manière dont ils sont réglementés, de la manière dont ils sont utilisés, de qui les utilise et à quelles fins. » Il est primordial d’établir une distinction claire. « Dans certains cas, l’utilisation de ces outils est incontournable pour gagner du temps, mais pour des applications censées être créatives, critiques et axées sur des valeurs, les êtres humains doivent garder le contrôle. C’est nous qui devons être aux commandes. »
Pour le projet de la Grande e general estoria, une équipe numérique évaluera les résultats des initiatives axées sur l’IA, précise M. Peña. « Par la suite, nous verrons ce que nous intégrerons au projet. » Si l’IA est utile, « nous ne l’écarterons pas. Nous l’adopterons parce qu’elle peut nous aider. Mais d’abord, assurons-nous-en. »
La généralisation du savoir
L’équipe du projet s’emploie à mettre sur pied la première édition numérique complète et annotée de la Grande e general estoria, qui sera interactive et universellement accessible. Pendant les sept années de financement du projet, l’équipe prévoit d’offrir des occasions de formation et de mentorat à des étudiantes et étudiants de diverses disciplines, de collaborer avec un éventail de partenaires à l’échelle internationale et de mobiliser des ressources pour le personnel enseignant, les musées et d’autres entités publiques. M. Peña se dit enthousiasmé par tous les enseignements que recèle le texte. « C’est un peu comme une permutation. Plus on connaît le texte, plus on voit de choses. Son sens s’élargit. »
Il se réjouit aussi de la structure du projet lui-même, en tant que méthodologie de sciences humaines. « Ce n’est plus mon projet, c’est notre projet […] Ce n’est pas l’édition de Francisco Peña de la Grande e general estoria, parce qu’elle ne m’appartient pas. Je ne peux pas me l’approprier. »
Au XIIIe siècle, la notion de paternité d’une œuvre n’était pas la même qu’aujourd’hui. Même si Alphonse X n’a pas écrit la Grande e general estoria, son nom y sera à jamais associé, tandis que les personnes qui l’ont rédigée resteront anonymes. Le roi, qu’on surnommera plus tard Alphonse le Sage, voulait offrir au monde une histoire universelle qui s’étend de la Genèse à son règne. Or, les dernières années de sa vie ont été marquées par une guerre civile et la rébellion de son fils aîné. Après la mort du roi en 1284, le projet, incomplet, a été abandonné – ses six volumes s’arrêtant au Nouveau Testament. Sept cents ans plus tard, il suit encore son cours, porté par des technologies que le roi n’aurait pu imaginer, et par la curiosité d’universitaires ayant à cœur de mettre au jour le savoir et les voix oubliées que renferment ses pages.
Laisser un commentaire
Affaires universitaires fait la modération de tous les commentaires en appliquant les principes suivants. Lorsqu’ils sont approuvés, les commentaires sont généralement publiés dans un délai d’un jour ouvrable. Les commentaires particulièrement instructifs pourraient être publiés également dans une édition papier ou ailleurs.