C’est un projet singulier et unique en France promet la Ville de Belfort. Les archives de la ville de Belfort veulent entraîner un logiciel de reconnaissance automatique d’écriture manuscrite basé sur des algorithmes d’intelligence artificielle indique la municipalité dans un communiqué de presse. Avec cet outil, elles souhaitent « rendre accessibles les anciennes délibérations du conseil municipal datant de 1790 à 1946 », indique le communiqué. « Une mine d’informations sur la vie et l’histoire de notre cité », poursuit le document.
Certes, les délibérations ont toutes été numérisées. Mais il est aujourd’hui impossible de trouver une information sans passer tous les documents en revue. Des outils de reconnaissance existent déjà pour les documents imprimés, comme les journaux, indique le communiqué, mais pas pour les documents manuscrits. « Or, les anciens registres de délibérations sont rédigés à la main, avec autant d’écritures que de rédacteurs, plus ou moins faciles à lire », observent les archives. Le logiciel prévoit d’indiquer le sujet recherché, qui s’affichera alors.
Le logiciel est développé par la société française Teklia. Mais pour être efficace, le logiciel doit apprendre. Les volontaires deviennent ainsi des entraîneurs, via une plateforme en ligne. « Le participant doit retranscrire dans le logiciel les anciennes délibérations du conseil municipal, détaille le communiqué. Lorsque les pages auront été retranscrites, le logiciel sera en mesure d’analyser les données et d’en extraire les informations demandés. »
Il y a 20 000 pages à traiter. La municipalité estime la tâche à un à deux mois en fonction du nombre de contributeurs. Si une page est trop difficile, le contributeur pourra passer ; un autre s’y frottera.
Comment participer ?
- Se connecter à : https://www.belfort.fr/culture/archives/devenir-contributeur-3006.html
- S’inscrire sur la plateforme
- Elle attribue un lot de pages manuscrites que le contributeur retranscrit ligne par ligne. On peut corriger les fautes, mettre de la ponctuation voire développer les abréviations. Chaque lot comprend 50 pages. Mais le contributeur est libre d’en faire 5, 10… Du rythme aussi ou de demander un autre lot.