Edit_Dunhuang

Le projet Edit_Dunhuang, centré sur le fonds Pelliot chinois de la Bibliothèque nationale de France (BnF), a pour objectif d’améliorer la transcription automatique des documents historiques chinois en développant des outils permettant de transformer le produit de la reconnaissance optique de caractères (OCR) en textes structurés et richement annotés. Ce processus vise à créer des corpus textuels vastes et exploitables pour des recherches tant qualitatives que quantitatives. La diversité du fonds Pelliot chinois offre les conditions idéales pour tester et affiner nos outils, garantissant ainsi leur efficacité et leur robustesse à travers une large gamme de documents. Notre objectif est de fournir une solution innovante pour la numérisation et l'analyse des textes chinois anciens, ouvrant ainsi de nouvelles perspectives pour les chercheurs dans le domaine des études chinoises.

Illustration projet Edit_Dunhuang

Illustration projet Edit_Dunhuang