1/ Cartographie du patrimoine musical et de ses métadonnées
Plusieurs ressources numériques contribuent à l’étude et la valorisation du patrimoine musical noté du Moyen Âge et de la Renaissance. Toutefois, ce paysage se révèle largement hétérogène en matière de technologie, type de données et degré d’accessibilité.
Le Cluster 6 Biblissima+ s’est ainsi donné pour mission de développer des solutions informatiques afin d’améliorer la consultation des sources musicales anciennes. L’objectif est de recourir à des systèmes capables d’agréger, de croiser et de réunir des numérisations et des métadonnées fondamentales pour la recherche. Une cartographie des ressources a permis au Cluster 6 d’identifier différents besoins et d’élaborer des « ponts » entre des bases de données et des fonds d’institutions de conservation.
DIAMMtoIIIF
Le projet DIAMMtoIIIF, développé dans le cadre du Cluster 6 Biblissima+ « Les défis du patrimoine musical », est un programme Python conçu pour générer des manifestes IIIF (International Image Interoperability Framework) à partir des données de l’API de la base de données DIAMM (Digital Image Archive of Medieval Music) et des serveurs de plusieurs bibliothèques telles que la BnF et la Bayerische Staatsbibliothek. Ce projet vise à accroitre l’accessibilité et l’interopérabilité des sources musicales médiévales en simplifiant leur consultation et leur manipulation dans des contextes numériques divers.
L'apport de ce projet réside dans sa capacité à faciliter l’accès aux partitions musicales anciennes tout en améliorant l’interaction des données. En générant des manifestes, DIAMMtoIIIF permet de standardiser et d'uniformiser la présentation des sources, renforçant ainsi leur visibilité et leur utilisation dans les études, tout en garantissant une meilleure préservation du patrimoine musical. Par ailleurs, il contribue à développer IIIF dans la sphère musicologique.
Alignement des données Ricercar et Biblissima+
Le programme musicologique RicercarLab du CESR a développé des outils numériques de visualisation et d’exploitation de corpus, de reconstitution d’espaces sonores et a constitué un très riche fonds documentaire. Il circonscrit le patrimoine musical écrit du Moyen Âge et de la Renaissance à l’exclusion de l’immense corpus du chant liturgique monodique chrétien. Dans le contexte de la refonte de ses bases de données, le RicercarLab a établi des modèles de données pour la description des sources et des œuvres musicales qui tiennent compte de leurs spécificités. Un travail d’alignement avec les référentiels Biblissima+ est en cours et permettra, à terme, d’accroitre les données musicales et musicologiques au sein du portail.
2/ Encodage et pérennité numérique des œuvres anciennes
Le Cluster 6, dans le cadre de ses activités liées à la préservation du patrimoine musical, se concentre également sur l’encodage des œuvres anciennes par le biais de la MEI (Music Encoding Initiative). L’objectif principal est de permettre une représentation numérique standardisée des partitions musicales et d’assurer leur intégrité une fois celles-ci publiées et partagées. Le format ouvre la voie à une analyse plus fine des œuvres tout en garantissant la conservation numérique de leurs supports. En collaborant avec le consortium en musicologie numérique Musica2 (IR* Huma-Num), le Cluster 6 cherche à étendre les possibilités du langage MEI afin qu’il puisse prendre en charge des notations anciennes et complexes, souvent ignorées par les formats traditionnels. Un premier projet, SubtiliorEditor, se concentre sur certaines notations sophistiquées de la fin du Moyen Âge.
De même, avec l’aide de ses partenaires internationaux, le Cluster 6 à récemment contribué à élaborer un convertisseur CMME vers MEI. Cet outil permet de convertir les œuvres musicales autrefois encodées dans le format CMME (Computerized Mensural Music Editing) vers le format MEI. L’objectif est d’assurer la pérennité de plusieurs milliers d’œuvres musicales, tout en permettant leur manipulation à des fins analytiques. La publication ouverte, via le Ricercar•data•lab, de l’édition numérique intégrale d’une trentaine de manuscrits musicaux du XVe siècle, dont ceux contenant le répertoire profane sur des textes français (chansons), est prévue à l’occasion des conférences MEI et MedRen de juin-juillet 2025.
3/ Intelligence artificielle et étude des sources
Le projet DeNotEM du Cluster 6 se concentre sur la reconnaissance automatique des notations musicales anciennes dans les manuscrits du Moyen Âge et de la Renaissance. Il fait suite au projet DIAMMtoIIIF dédié à améliorer l’affichage et la consultation des sources musicales en utilisant le protocole IIIF et les ressources de la base de données DIAMM. Pour enrichir davantage les manifestes IIIF, le Cluster 6 a développé des modèles de reconnaissance YOLO visant à alimenter des fichiers d’annotation JSON. Les modèles ont été entrainés dans le but d’inférer les noms des parties musicales ainsi que leur emplacement dans les sources. DeNotEM se concentre dans un premier temps sur les notations carrées (mesurées ou non) des derniers siècles du Moyen Âge.
Les avancées de DeNotEM mènent à progressivement perfectionner les modèles de reconnaissance et, ainsi, à repousser les limites des objectifs futurs. D’une part, des algorithmes de post-traitement sont en cours de développement pour corriger les lacunes des modèles de détection. D’autre part, l’aboutissement de DeNotEM sera de créer une architecture de modèles susceptible de générer d’autres genres de métadonnées et de croiser les résultats des modèles existants avec des outils externes, comme l’OCR Kraken. Les tests expérimentaux menés jusqu’à présent sont encourageants. À terme, le système sera capable de reconnaître non seulement les parties musicales, mais aussi d’extraire les paroles ou les incipits des voix, de proposer des datations et de distinguer différents types de notations (traditions régionales, notations mixtes, etc.).