Date de prise de fonction : début décembre
Durée du contrat : jusqu’à 12 mois
Lieu de travail : laboratoire ERIC (Université de Lyon 2, campus de Bron) Conditions de travail : présentiel au laboratoire ERIC (si la situation sanitaire le permet). Des séjours de quelques jours chacun sont prévus sur le site d’EDF R&D en région parisienne (frais pris en charge).
Contexte : Ce contrat constitue l’élément central du projet POIVRE, financé par le programme IRSDI de la fondation Jacques Hadamard (https://www.fondation-hadamard.fr/). Le projet implique des chercheurs du laboratoire ERIC et d’EDF R&D. Les membres du laboratoire ERIC, en collaboration avec leurs partenaires, travaillent depuis quelques années sur le traitement des données textuelles [1-3] et sur l’apprentissage automatique de représentations adaptées aux réseaux de documents [4-7].
Sujet : Le projet POIVRE vise à construire des nouvelles solutions pour analyser les points de vue, solutions qui seront appliquées à l’analyse des débats sur Twitter au sujet du nucléaire dans la campagne présidentielle française. En effet, cette plateforme d’échange est un réseau d’information hétérogène qui permet aux individus de communiquer en postant des messages (information textuelle) via différents mécanismes (relation de suivre ou d’être suivi, faire suivre le message par ReTweet, aimer ou mentionner). Or, ce type de réseau est un lieu privilégié d’échange de points de vue où s’opèrent des phénomènes de diffusion de l’information, de regroupements partisans, d’influence.
L’objectif du post-doctorant.e est de concevoir des nouvelles méthodes pour analyser les points de vue tels qu’ils se figent dans un réseau d’information hétérogène comme Twitter. Pour cela, l’idée principale consiste à avoir recours à des approches de deep learning comme les Graph Neural Networks (GNN) en les adaptant aux différentes caractéristiques liées à la question du point de vue. En effet, celui-ci peut dépendre de la position du noeud dans le graphe mais également de différents éléments (par ex. les arguments) développés dans le contenu textuel des messages. Les méthodes développées doivent pouvoir être utilisées pour identifier des communautés aux points de vue similaires.
Les méthodes développées dans ce travail seront notamment testées sur un jeu de données issue de Twitter, récolté à l’occasion de la campagne présidentielle qui débute en France. Ce jeu de données portera en particulier sur les débats que suscitent les questions sur l’énergie (nucléaire, énergies renouvelables). En plus du support de chercheurs en Informatique avec une expérience en machine learning et en analyse des réseaux sociaux, le.a post-doctorant.e pourra bénéficier de l’expertise de sociologues spécialistes des questions de l’étude des représentations sur le sujet de l’énergie.
Profil attendu : Nous recherchons principalement un docteur en machine learning ayant travaillé sur des données en réseau (graphes). Une expérience en NLP serait un vrai plus, ainsi qu’un intérêt pour le travail collaboratif en étroite collaboration avec les sciences sociales.
Encadrement : Au laboratoire ERIC, le.a post-doctorant.a sera encadré.e par Julien Velcin (http://eric.univ-lyon2.fr/~jvelcin/) et Adrien Guille (https://adrienguille.github.io). Le travail est en collaboration avec Philippe Suignard et Mathieu Brugidou (https://www.pacte-grenoble.fr/membres/mathieu-brugidou) à EDF R&D.
Candidature : Merci d’envoyer votre candidature à l’adresse suivante : julien.velcin__AT__univ-lyon2.fr . Votre dossier doit comporter :
– CV
– lettre de motivation
– lettre de recommandation (optionnel).
Références
[1] Clément Christophe, Julien Velcin, Jairo Cugliari, Philippe Suignard and Manel Boumghar. Monitoring geometrical properties of word embeddings for detecting the emergence of new topics. Accepted at the Conference on Empirical Methods in Natural Language Processing (EMNLP), 2021.
[2] Clément Christophe, Julien Velcin, Jairo Cugliari, Philippe Suignard and Manel Boumghar. Change detection in textual classification with unexpected dynamics. Expert Systems with Applications (ESWA), vol.176, Aug. 2021.
[3] Ian Davidson, Antoine Gourru, Julien Velcin, and Yue Wu. Behavioral differences: insights, explanations and comparisons of French and US Twitter usage during elections. Social Network Analysis and Mining, 10(6), 2020.
[4] Robin Brochier, Adrien Guille, and Julien Velcin. Global vectors for node representations. In Proceedings of the Web Conference (WWW), pages 2587?2593, 2019.
[5] Robin Brochier, Adrien Guille, and Julien Velcin. Inductive Document Network Embedding with Topic-Word Attention. In European Conference on Information Retrieval (ECIR), 2020.
[6] Antoine Gourru, Adrien Guille, Julien Velcin, and Julien Jacques. Document network projection in pretrained word embedding space. In European Conference on Information Retrieval (ECIR), pages 150?157. Springer, 2020.
[7] Antoine Gourru, Julien Velcin, and Julien Jacques. Gaussian embedding of linked documents from a pretrained semantic space. In Proceedings of the 29th International Joint Conference on Artificial Intelligence (IJCAI), 2020.