L’équipe « Bibliothèques Virtuelles Humanistes » du Centre d'études supérieures de la Renaissance organise une nouvelle session de la formation « TEI 2 : Encoder en XML-TEI, niveau avancé ».
Elle se tiendra les 11 & 12 juin 2026, au CESR, à Tours (en présentiel uniquement).
Vous trouverez plus d'informations ci-dessous et sur le site dédié : https://formation-tei-2.sciencesconf.org/
Les candidatures (en ligne) sont ouvertes jusqu'au 20 avril 2026 à midi.
Présentation de la formation
La formation « TEI 2 : encoder en XML-TEI » s’adresse aux utilisateurs déjà familiers du langage XML-TEI et engagés dans un projet de recherche, d’édition ou de valorisation de corpus. Pendant deux jours, les formateurs proposeront plusieurs modules pratiques d’approfondissement des spécifications, de personnalisation de la TEI et de mise en œuvre pour des modélisations complexes de documents. Cette quatrième session se tiendra les 11 & 12 juin 2026.
Cette session accordera une place particulière à l’inscription de la TEI dans une chaîne éditoriale complète, depuis la transcription de sources patrimoniales (manuscrites et imprimées) en vue de leur publication, de leur interrogation et de leur réutilisation scientifique. Elle abordera ainsi l’articulation des outils et méthodes d’automatisation de l’ATR avec l’encodage XML-TEI, étendu à l’enrichissement sémantique, l’alignement avec les référentiels, le contrôle et la qualité des données produites. Une attention particulière sera portée aux usages de l’intelligence artificielle dans les workflows éditoriaux : aide à la transcription et à la structuration, pré-annotation, repérage d’entités nommées, normalisation, alignement avec des autorités. La formation vise à montrer comment intégrer ces outils de manière raisonnée, documentée et vérifiable dans les pratiques éditoriales conformes aux exigences de la TEI autant que de la recherche.
Cette formation, initiée en 2021 et désormais biennale, est le fruit des efforts conjoints de chercheurs et d'ingénieurs, coordonnés par le programme de recherche « Bibliothèques Virtuelles Humanistes » (BVH) du CESR, avec les soutiens en 2026 du consortium ARIANE de l'IR* Huma-Num, de l'Equipex Biblissima+, et de l'ERC PRIMA. Elle s’inscrit dans une action commune visant à encourager les chercheurs, les personnels des bibliothèques et des unités de recherche à s’approprier la TEI comme moyen d’édition et d’analyse des textes aussi bien pour des finalités scientifiques que de diffusion à l’intention du public plus large.
Objectifs
La formation a pour objectif de rendre les chercheurs, ingénieurs et personnels de soutien à la recherche plus autonomes dans leur travail de modélisation et de balisage en TEI. Dans des projets réels, il est nécessaire dorénavant de travailler avec plusieurs standards à la fois, de définir ou de faire évoluer des choix de personnalisation de l'encodage (notamment de valeurs d'attributs), de penser l’architecture des données ainsi que la chaîne éditoriales en amont, de prévoir la validation du balisage TEI produit par plusieurs collaborateurs. La formation abordera donc l'usage et la mise en œuvre de la TEI dans un contexte avancé de recherche et de production, où le standard ne sert pas simplement à baliser un texte, mais à organiser un ensemble d'opérations : transcription, description, annotation, alignement, etc. Une attention particulière sera portée sur la manière d'intégrer et d'articuler les interventions humaines et celles automatisées dans la chaine de traitement, afin d'assurer la traçabilité des transformations opérés et l'évaluation critique des résultats issus des outils d'intelligence artificielle. La formation alternera apports théoriques, démonstrations d’outils et travaux dirigés.
Les participant·e·s dont la candidature aura été sélectionnée (20 places maximum) seront invité·e·s à soumettre les cas et interrogations spécifiques relatifs à leur propre corpus encodé en TEI, en amont de la formation. Le dernier module « ouvert » leur permettra ainsi de bénéficier de l’expertise des formateurs qui discuteront des solutions applicables et conformes aux recommandations de la TEI.
Public visé
Chercheurs, ingénieurs, personnels d'appui à la recherche et doctorants engagés dans un projet de recherche, d'édition ou de valorisation de corpus recourant déjà à la TEI, et souhaitant approfondir leurs pratiques d'encodage, de modélisation et de mise en œuvre dans une chaine de traitement éditoriale
Pré-requis
- Avoir une bonne connaissance pratique et appliquée du XML et de la TEI
- Avoir une expérience effective de l'encodage dans le cadre de projet de recherche, d'édition ou de valorisation.
Il est recommandé d'avoir au minimum suivi au préalable une formation d'initiation à la TEI permettant d’acquérir les bases, poursuivie par une mise en application concrète dans le cadre d’un projet de recherche ou de valorisation.
Équipe pédagogique
- Lou Burnard (Consultant indépendant, Co-fondateur de la TEI)
- Serena Crespi (Ingénieure de recherche – post-doctorante, projet PRIMA – CESR)
- Mathieu Duboc (Ingénieur indépendant, CodeX)
- Carlos-Emiliano Gonzalez-Gallardo (MCF, Université de Tours – CESR / LIFAT)
- Alexei Lavrentiev (Ingénieur de recherche, CNRS, IHRIM, UMR 5317,Lyon)
- Elena Pierazzo, Resp. pédagogique de la formation (Pr., Université de Tours, projet PRIMA – CESR)
Programme
Jour #1 – Jeudi 11 juin 2026
09:00 – 09:30 Accueil des participant·e·s.
09:30 – 11:00 TEI customisation : principes & pratiques. Ajout et sélection des éléments et attributs pour créer son propre système TEI – Lou Burnard
11:00 – 11:20 Pause café
11:20 – 13:00 Séance d’introduction à la transcription automatique avec e-scriptorium – Elena Pierazzo, Serena Crespi
13:00 – 14:00 Déjeuner
14:00 – 15:30 TEI conformance : implications de la personnalisation ; intégration d’autres vocabulaires (par ex. MathML, MEI, EAD), usage de <xenoData> – Lou Burnard
15:30 – 15:50 Pause café
15:50 – 18:00 TEI et prosopographie. Intégration avec les fichiers d’autorité (VIAF…) – Mathieu Duboc ; Outils pour l’encodage des entités nommées avec l’IA – Carlos-Emiliano González-Gallardo
Jour #2 – Vendredi 12 juin 2026
09:00 – 10:00 De l’ATR à la TEI et des éditions ultra-diplomatiques avec <sourceDoc> – Serena Crespi, Elena Pierazzo
10:00 – 11:00 Encodage linguistique : Tokenisation, annotation « inline » et « standoff », échange de données avec les outils de TAL (ud-pipe, taggeurs, etc.) – Alexei Lavrentiev
11:00 – 11:20 Pause café
11:20 – 13:00 Architecture des données avec TEI Corpus, chaînes éditoriales et gestion de fichier XML-TEI avec XPath – Lou Burnard, Alexei Lavrentiev, Elena Pierazzo
13:00 – 14:00 Déjeuner
14:00 – 16:00 Séance de questions | réponses : Les participant·e·s confirmé·e·s enverront leurs questions pour le 27 mai 2026 au plus tard (via le menu “Mes dépôts” en ligne). – Lou Burnard, Serena Crespi, Mathieu Duboc, Carlos-Emiliano González-Gallardo, Alexei Lavrentiev, Elena Pierazzo
Modalités de candidature
- 20 places
- Formation gratuite
- La candidature doit être déposée en ligne (prévoir un CV court, une lettre de motivation présentant votre projet TEI, et éventuellement un document de présentation de votre projet plus détaillé).
- Les deux déjeuners seront pris en charge par les organisateurs.
- Les frais de missions (transport, hébergement, repas) sont à la charge des candidat·e·s ou de leur employeur.
- Pour les membres du consortium ARIANE, une prise en charge des frais de mission est possible dans la limite du budget disponible : si vous souhaitez en bénéficier, veillez à la signaler dans le formulaire de candidature. Les demandes seront soumises et évaluées en concertation avec le comité de direction du consortium.
Calendrier
- Date limite de candidature (via le menu Candidature) : 20 avril 2026 à 12:00 (midi)
- Date limite d’évaluation des candidatures et réponses aux candidat·e·s : 20 avril 2026
Attention, l’inscription sur sciencesconf ne vaut pas admission à la formation. Les dossiers sont sélectionnés à la fermeture des inscriptions, et les postulant·e·s seront prévenu·e·s s’ils et elles sont accepté·e·s ou refusé·e·s.
Avec le courriel d’acceptation, il sera demandé aux participant·e·s de rédiger et transmettre aux formateurs une liste de questions précises liées à leurs besoins et problématiques d’encodage TEI. Ces questions feront l’objet d’une synthèse et d’une réponse des formateurs à l’occasion du dernier module de la formation.
- Date limite de dépôt des questions pour les intervenant·e·s (via le menu Mes dépôts) : 27 mai 2026
- Dates de la formation, en présentiel uniquement, à Tours : 11 & 12 juin 2026
Renseignements
Sandrine Breuil, CESR-BVH, sandrine.breuil@univ-tours.fr
Informations & candidatures
Jusqu’au 20 avril à midi, en ligne via : https://formation-tei-2.sciencesconf.org