Cluster 4 – Traitement approfondi des systèmes graphiques et analyse des documents

1/ Analyse des écritures anciennes et environnement d’annotation : Archetype et eScriptorium

Pour mener des recherches transversales en paléographie, il faut définir une, voire plusieurs ontologies d’écritures et les intégrer dans un système d’annotation et d’analyse structuré.

Le logiciel Archetype, libre et gratuit, doit être entièrement redéveloppé pour en assurer la pérennité au sein d’e-Scripta. Il a été conçu dans le but d’offrir une méthodologie visible et reproductible permettant d’explorer les données paléographiques, de les communiquer comme preuves et arguments et de gérer et afficher des textes électroniques (telles que des éditions et traductions, des descriptions paléographiques et codicologiques, etc).

Associé à Kraken ainsi qu'à des outils d'annotations au sein d'eScriptorium, on obtiendra une infrastructure avec une interface ergonomique pour les tâches suivantes :

  • Import automatique d’images à partir d’un manifeste IIIF.
  • Saisie de données de « vérité de base » (« ground truth ») pour entraîner Kraken et pour corriger ses sorties.
  • Annotation des images selon la (ou les) ontologie(s) de l’écriture élaborée(s) à partir de celle d’Archetype.
  • Annotation des textes avec un balisage de TEI XML.
  • Publication des textes, images et annotations.
  • Import et export de données dans différents formats standards, tels que les annotations IIIF, ou PAGE, Alto ou TEI XML.

2/ MultiPal pour dater, localiser, lire toutes les écritures

Dans le cadre du projet MultiPal (tutoriel interactif en paléographie), on veut :

  • augmenter le nombre d’exercices dans des écritures déjà représentées pour mieux refléter leur étendue géographique et chronologique,
  • inclure des exercices dans d'autres systèmes d'écriture,
  • créer, en interaction avec Archétype, un Album paléographique qui servira de base à la typologie des écritures et de référence accessible aidant à la datation des manuscrits.