Modèles et outils d'apprentissage profond (ModOAP)
Labex Les Passés dans le Présent (PasP)
Le projet ModOAP est conçu autour de deux objectifs principaux. En premier lieu, nous souhaitons développer une boîte à outils d’analyse de données massives pour des projets consacrés aux Sciences Humaines et Sociales. Elle reposera sur des modèles pouvant être aisément adaptés à différents types de corpus textuels et graphiques, et comportera des programmes réutilisables par les institutions et laboratoires impliqués dans le Labex, et plus généralement par l’ensemble de la communauté scientifique en SHS. Ces outils (classification d’images, d’unités textuelles, reconnaissance de structures, détection de similarités…) feront l’objet d’une élaboration collective en partenariat avec d’autres projets du Labex et d’ateliers de formation à destination des chercheurs. En second lieu, ce projet vise à expérimenter ces outils sur deux corpus particulièrement importants pour l’analyse de la construction d’une mémoire collective : les manuels scolaires, à travers les fonds numérisés par la BnF, et le photoreportage, par le biais du fonds Kagan conservé à La Contemporaine. Grâce à l’analyse de données massives permise par les outils d’apprentissage profond, nous souhaitons explorer la construction d’une mémoire institutionnelle et scolaire et sa transmission par les manuels, et comprendre la manière dont la presse peut contribuer à la formation d’une mémoire collective médiatique, par la réutilisation et la rediffusion d’images sur le temps long.
Responsable du Projet
Julien SCHUH , Université Paris Nanterre - CSLF EA 1586
Partenaires au sein du labex
Bibliothèque nationale de France (BnF) Centre des Sciences des Littératures en langue Française (CSLF) - EA 1586 La contemporaine | bibliothèque, archives, musée des mondes contemporains Modèles, Dynamiques, Corpus (MoDyCo) - UMR 7114 Huma-Num : la TGIR des humanités numériques