change language     -         


Les archives secrètes du Vatican bientôt accessibles grâce à l'intelligence artificielle?

May 9, 2018, 12:35 pm

Type: history

       




news_image

Quelque 400 ans après la création du fonds, les textes que renferme la bibliothèque privée du Vatican demeurent très difficilement accessibles: l'intelligence artificielle pourrait changer la donne.


 

Avec des rayonnages quadricentenaires et longs de quatre-vingt-cinq kilomètres, les archives secrètes du Vatican recèlent plus de mille ans d'histoire, avec des textes allant du VIIIe au XXe siècle, de la Bulle contre les erreurs de Martin Luther et ses disciples aux plus obscures correspondances papales.

Enterrés sous la cour du musée du Vatican, ils constituent une mine d'or pour les chercheurs, qui demeure pourtant largement inexploitée. Quelques pièces ont été progressivement ouvertes par Paul VI, Jean-Paul II et Benoît XVI, mais le repos de certaines étagères n'est encore troublé que par les rares bruissements de mitres émis par des proches du pape: dérobées aux yeux des badauds curieux tout autant qu'à ceux des chercheurs accrédités.





Vers une numérisation intelligente?

Si un travail de numérisation de ces archives a été amorcé depuis quelques années, il ne concerne qu'un nombre dérisoire par rapport aux ouvrages présents dans les sous-sols du Vatican. La plupart du temps, les pages, seulement scannées, n'ont pas été retranscrites en texte informatique, laissant les recherches relativement laborieuses, quand elles ne demandent pas encore d'avoir à se rendre sur place.

 

Cela pourrait bien changer dans les années à venir. Le projet In Codice Ratio, mis en branle par une équipe de chercheurs et développeurs romains, cherche à croiser les ressources de l'intelligence artificielle avec un logiciel de reconnaissance optique de caractères (ROC), ce qui permettrait de rendre accessibles ces documents comme, en théorie, ceux de tant d'autres fonds d'archives par-delà la Bibliothèque apostolique vaticane.

«La ROC a été utilisée pour scanner des livres et d'autres documents imprimés pendant des années, mais elle n'est pas bien adaptée pour les ressources des archives secrètes du Vatican. La ROC traditionnelle sépare les mots en des séries d'images-lettres en cherchant les espaces entre les lettres. Elle compare ensuite chaque lettre-image à la banque de lettres présente dans sa mémoire. Après avoir déterminé quelle lettre correspond le mieux à l'image, le logiciel traduit la lettre en code informatique (ASCII) et rend ainsi le texte consultable», explique The Atlantic.

Reconnaître les caractères

Le défi, avec le fonds des archives vaticanes, est qu'il est principalement constitué de manuscrits, dont l'écriture peut associer calligraphie et lettres cursives, beaucoup plus difficile à identifier de façon systématique, ne serait-ce qu'au regard de l'absence d'espace entre les lettres. Si la ROC ne peut pas dire à quel endroit commence et se termine une lettre, il lui est alors impossible de les identifier. Or elle a besoin de les identifier pour pouvoir les segmenter: ce phénomène est connu sous le nom de paradoxe de Sayre, qui désigne cette impasse informatique face à la reconnaissance de l'écriture manuscrite.





Les acteurs du projet In Codice Ratio ont donc cherché une alternative fondée sur le principe d'une «segmentation en puzzle»: plutôt que de reconnaître des caractères, un réseau de neurones convolutionnels va tâcher d'en identifier les unités minimales, à partir de séries de traits horizontaux ou verticaux. Les unités les plus fines, là où il y a moins d'encre ou, en traduction numérique, de pixels, sont ensuite utilisées pour déterminer les liaisons entre différentes lettres.

Il s'agissait ensuite d'entraîner l'intelligence artificielle à reconnaître à partir de différents modèles les caractères de l'alphabet latin médiéval: un travail mené avec l'aide de cent-vingt lycéens, auxquels les chercheurs ont fait appel.

Cette reconnaissance de caractères manuscrits n'étant pas suffisante dans certains cas ambigus, les chercheurs ont dû établir des bases de données regroupant les combinaisons de lettres les plus communes et, par revers, celles qui ne présentent aucune occurrence dans la langue latine (la confusion est surtout présente par rapport aux enchaînements de jambages: ainsi «nn» est plus probable que «iiii»).

Jusqu'à présent, les résultats sont mitigés et appellent encore un perfectionnement du logiciel: cela devrait venir avec le temps et l'entraînement. À terme, cet usage de l'intelligence artificielle pourrait permettre de retranscrire de gros volumes de texte dont le traitement manuel serait un travail de titan –de fait, encore en vaste chantier à ce jour.

Cette technique demeure cependant le privilège des écritures les plus canoniques: selon la qualité des manuscrits, la régularité de l'écriture d'un même texte et l'ampleur d'un échantillon, il est toujours possible que l'expertise humaine ait le dernier mot.


Source de l'article: slate



allnews_image

Anne Hidalgo, la maire de la capitale, réclame pour sa part depuis des mois une «mise à l'abri» pour les quelque 2 300 personnes qui habitent ces campements de fortune dans des conditions jugées «indignes» par le Défenseur des droits.

Lire l'article


allnews_image

Cette année, après quatre décennies d'essais infructueux, l'agence spatiale américaine a testé avec succès un prototype de réacteur qui pourrait alimenter des colonies lunaires ou martiennes.

Lire l'article


allnews_image

L’isolement social chronique a des effets qui fragilisent la santé mentale des mammifères, souvent associé, par exemple, à la dépression et au trouble de stress post-traumatique chez les humains. Une récente étude suggère aujourd’hui que cet isolement soc

Lire l'article



allnews_image

Suite à la présentation par Jean-Louis Borloo le 26 avril dernier d’un rapport ambitieux, c’est mardi 22 mai que le président de la République détaillera son programme pour améliorer la vie des habitants des quartiers défavorisés, non pas avec de "grands

Lire l'article


allnews_image

L'ancienne députée du Front national Marion Maréchal-Le Pen a effacé sur ses comptes Facebook et Twitter le nom Le Pen, hérité de sa mère Yann et porté par sa tante Marine, présidente du FN, et son grand-père Jean-Marie, cofondateur du parti.

Lire l'article



allnews_image

Une cyberattaque «sans précédents» a touché des banques mexicaines. Par mesure de sécurité, les virements de plus de 2100 euros ont été bloqués.

Lire l'article


allnews_image

Avec le retour des sanctions, toute entreprise commerçant avec l'Iran risque de voir ses crédits dénoncés en France à l'échéance du moratoire fixé par Donald Trump.

Lire l'article


allnews_image

A l’occasion des débats sur la loi Alimentation, qui commencent la semaine prochaine à l’Assemblée Nationale, le député LREM Matthieu Orphelin déposera un amendement proposant l’interdiction du glyphosate d'ici à 2021.

Lire l'article


allnews_image

Avec le massacre perpétré par l’armée israélienne contre des civils palestiniens ce 14 mai, la question des partenariats entre l’Union européenne et le gouvernement de Netanyahou se pose. D’autant que Bruxelles y finance des recherches militaires et que d

Lire l'article


allnews_image

Depuis quelques semaines, les autorités se divisent sur l’épineux sujet de la démoustication de la Presqu’île d’Ambès. Le maire juge « insuffisants » les traitements imposés par le préfet, et le conseil départemental refuse de financer un épandage de bioc

Lire l'article


allnews_image

La lutte contre le gaspillage alimentaire, c’est aussi pendant l’été et la Banque Alimentaire à besoin de bénévoles pour ramasser des produits alimentaires et les redistribuer.

Lire l'article


allnews_image

Une équipe de biologistes de l’Université de Californie à Los Angeles rapporte avoir transféré le « souvenir » d’un escargot marin à un autre. Cette recherche pourrait conduire à de nouvelles façons de réduire le traumatisme des souvenirs douloureux, et p

Lire l'article


allnews_image

Le plus récent tournant bizarre de la politique chinoise de Donald Trump, qui accorde des concessions énormes au géant chinois de l'électronique ZTE à la veille de négociations commerciales entre les deux pays, démontre une fois de plus l’ampleur des conf

Lire l'article




allnews_image

Ce 12 mai, la "pêche" sera acceptée dans des commerces de Paris en plus d'une centaine de la ville limitrophe de Montreuil (93) où cette monnaie locale est née. Elle favorise le commerce et l'artisanat local qui l'acceptent en paiement. D'autres monnaies

Lire l'article


allnews_image

INDE La grêle et des orages qui ont abattu des murs, des arbres et des pylônes électriques...

Lire l'article


allnews_image

Discussion autour des jeux et de la réincarnation avec des moines à Wat Chedi Luang Mai, Thaïlande.

Lire l'article