Cluster 4 – Traitement approfondi des systèmes graphiques et analyse des documents

Poster cluster 4

Poster présenté lors des journées annuelles Biblissima+ le 28 mai 2024 à l'Humathèque Condorcet (Campus Condorcet, Aubervilliers).

Stokes, P., Hablot, L., & Olszowy-Schlanger, J. (2024). Biblissima+ Cluster 4 : Traitement approfondi des systèmes graphiques et analyse des documents.
Disponible sur Zenodo : https://doi.org/10.5281/zenodo.11366240
Licence : Creative Commons Attribution

Le cluster 4 se concentre sur la modélisation et la représentation numérique des systèmes graphiques et les objets qui les portent. Ces systèmes graphiques comprennent l’écriture, mais aussi d’autres formes de la communication telles que les formes héraldiques et les sceaux.

L’analyse des systèmes graphiques a besoin d’une infrastructure commune, y compris un moyen d’aligner les différentes terminologies et méthodes descriptives permettant l’interopérabilité, l’échange et l’interconnexion de données. Il faut pour cela définir une, voire plusieurs ontologies d’écritures et d’autres systèmes graphiques et les intégrer dans un système d’annotation et d’analyse structuré, ce qui permettrait aux chercheurs d’utiliser des modèles similaires mais adaptés à leurs besoins particuliers. Il est aussi clair que tout modèle d’écriture réussi doit également prendre en compte l’objet qui porte l'écriture, et les discussions au sein du cluster inclut également la discipline émergente de la codicologie numérique.

1/ Analyse des écritures anciennes et environnement d’annotation : Archetype et eScriptorium

Le logiciel Archetype, libre et gratuit, doit être entièrement redéveloppé pour en assurer la pérennité au sein d’e-Scripta. Il a été conçu dans le but d’offrir une méthodologie visible et reproductible permettant d’explorer les données paléographiques, de les communiquer comme preuves et arguments et de gérer et afficher des textes électroniques (telles que des éditions et traductions, des descriptions paléographiques et codicologiques, etc.).

Associé à Kraken ainsi qu'à des outils d'annotations au sein d'eScriptorium, on obtiendra une infrastructure avec une interface ergonomique pour les tâches suivantes :

  • Import automatique d’images à partir d’un Manifeste IIIF.
  • Saisie de données de « vérité-terrain » (« ground truth ») pour entraîner Kraken et pour corriger ses sorties.
  • Annotation des images selon la (ou les) ontologie(s) de l’écriture élaborée(s) à partir de celle d’Archetype.
  • Annotation des textes avec un balisage de TEI XML.
  • Publication des textes, images et annotations.
  • Import et export de données dans différents formats standards, tels que les annotations IIIF, PAGE, ALTO ou TEI XML.

2/ MultiPal pour dater, localiser, lire toutes les écritures

Dans le cadre du projet MultiPal (tutoriel interactif en paléographie), on veut :

  • augmenter le nombre d’exercices dans des écritures déjà représentées pour mieux refléter leur étendue géographique et chronologique,
  • inclure des exercices dans d'autres systèmes d'écriture,
  • créer, en interaction avec Archetype, un Album paléographique qui servira de base à la typologie des écritures et de référence accessible aidant à la datation des manuscrits.

3/ Modélisation de formes héraldiques

Dans le domaine de l’héraldique, on développera le module déjà construit dans e-Signa (SAPRAT, EPHE-PSL), qui permet de formaliser les informations héraldiques et de les restituer sous forme d’un dessin normalisé et d’une description standardisée. L’interface de recherches héraldiques permettra d’interroger par image ou texte les ressources du portail à l’aide d’un outil simple de reconstruction graphique.