Contexte du stage : Le projet LIFRANUM vise à constituer et analyser le corpus des productions littéraires francophones nativement numériques. Il s?agit d?un projet financé par l?Agence Nationale de la Recherche (ANR) qui regroupe un laboratoire de sciences humaines (MARGE), un laboratoire d?informatique (ERIC) et la Bibliothèque Nationale de France (BnF). Dans le cadre de ce projet, le laboratoire ERIC recherche un.e candidat.e pour un stage qui débutera en février ou mars 2021.
Mission : La personne recrutée aura pour mission d?engager un traitement du contenu littéraire produit et diffusé 100 % sur le web (par exemple, twittérature, forme de littérature numérique pratiquée sur Twitter). A cette fin, un corpus de données textuelles collecté par les chercheurs du projet sera mis à disposition afin d?alimenter les modèles d?apprentissage profond. Les modèles devront intégrer la représentation des auteurs dans un espace latent afin de répondre à des questions pratiques comme calculer des similarités entre auteurs ou découvrir des communautés dont la production partage des similitudes.
En particulier, une question intéressante est de savoir s?il est possible de résoudre des tâches de ?transfert de style? (?style transfer) ? sur le texte comme cela a été fait sur les images. Pour contribuer à répondre à cette question, le/la stagiaire aura pour mission de tester des approches récentes de génération automatique de texte employant des réseaux de neurones profonds (?deep learning).
Afin de mettre en place une expérimentation, la personne recrutée aura l?opportunité d?utiliser des solutions innovantes de traitement de données à large échelle (?big data) pour les humanités numériques. Enfin, le/la stagiaire pourra aussi être amené à participer à la proposition de nouvelles solutions adaptées aux données du projet LIFRANUM.