Dépouiller et analyser 13 000 fiches du personnel de l’entreprise DMC entre 1900 et 1950, ainsi que des milliers d’actes de naissance et de décès de l’état civil de Belfort entre 1807 et 1919 : un travail de Titan pour des chercheurs en histoire ! Une équipe du laboratoire RECITS (Recherche et Etude sur le Changement Industriel, Technologique et Sociétal) de l’Université de technologie de Belfort-Montbéliard (UTBM) conduit des recherches sur les ouvrières de l’entreprise DMC (Dolfus Mieg et Compagnie). Cette entreprise mulhousienne s’est implantée à Belfort, dans l’actuel Techn’hom, après la guerre de 1870 et l’annexion de l’Alsace. L’équipe de recherche en Humanités numérique histoire et démographie est dirigée par l’historien Laurent Heyberger et l’informaticien Franck Geshter. Ce dernier est le directeur de recherche d’un jeune lyonnais, Gabriel Frossard, venu à l’UTBM pour réaliser sa thèse de doctorat.
Des milliers de fiches à décrypter
Gabriel Frossard a suivi des études d’ingénieur en informatique à Lyon, avant de venir poursuivre ses études à l’UTBM et préparer un doctorat. Il apporte à l’équipe ses compétences en intelligence artificielle, notamment pour dépouiller les actes de décès de l’état civil de Belfort et les fiches que tenait l’entreprise DMC sur ses ouvrières. L’entreprise employait en effet une large majorité de femmes à Belfort (environ 3000 femmes sur environ 5000 ouvriers). Recouper les données de fiches du personnel et d’actes de décès peut permettre de comprendre les causes d’un arrêt de travail. Ou alors d’identifier des ouvrières filles-mères isolées, avec un enfant reconnu ou non et des répercussions sociales que cela peut avoir. Les recherches tendent par exemple à montrer que les enfants abandonnés et placés dans un orphelinat avaient plus de chances de survie, car moins soumis à la précarité…
L’enjeu pour Gabriel Frossard est d’utiliser le meilleur outil pour faire une acquisition numérique de fiches écrites à la main. Un premier travail de saisie de fiche « à la main » a été effectué par des étudiants auto-entrepreneurs. Ces premières données ont constitué une première « base d’expérience » venue nourrir l’intelligence artificielle. Gabriel Frossard a comparé les performances de plusieurs LLM, c’est-à-dire des programmes capables de reconnaitre et de générer du texte. Il a identifié un logiciel du laboratoire LITIS de l’université de Rouen, qui identifie les mots (« entités nommées ») et est capable de classer les informations ainsi recueillies. Ce type d’outil permet de stocker des informations facilement accessibles par un informaticien. Un des enjeux va être de définir comment un historien pourra lui aussi y accéder aisément.
Les travaux de recherche de l’équipe de RECITS déboucheront probablement sur une parution sur l’histoire des ouvrières de DMC à Belfort. Le travail effectué sur les fiches d’état civil de Belfort stockées aux archives nourrira des publications en informatique et en infographie historique. Une utilisation des données ainsi traitées par le grand public nécessitera sans doute un travail complémentaire en informatique : un sujet intéressant pour un étudiant en master, estime Gabriel Frossard.
Actuellement en dernière année de thèse, il espère décrocher ensuite un poste de post-doctorant ou d’ingénieur d’étude toujours dans le domaine de l’IA appliquée aux sciences humaines.