L?équipe DMD co-organise avec le groupe de travail TextMine une journée nationale sur la fouille de textes, le lundi 10 juin à Lyon, à l?espace Marc Bloch de la MSH. Vous trouverez ci-après le programme détaillé. Pour vous inscrire : https://textmine-lyon.sciencesconf.org/registration?lang=fr
En plus des exposés, l?édition 2025 du défi TextMine (i.e. compétition NLP francophone sur Kaggle) que je co-organise avec Airbus Defence sera présentée, avec 500 euros à la clef pour la meilleur contribution ?
Matinée
- 9h00 – 10h00 : Accueil des participants / Petit-déjeuner
- 10h00 – 10h30 : Lancement de la journée et présentation du défi TextMine 2025
- 10h30 – 11h00 : Communication – Exploration de la sémantique dans l?attention d?un modèle de langue pré-entraîné, Frédéric CHARPENTIER, Jairo CUGLIARI, Adrien GUILLE
- 11h00 – 12h00 : Keynote – SINr : Une approche frugale pour l?apprentissage de plongements interprétables, Nicolas DUGUE
Déjeuner
- 12h00 – 13h00 : Buffet
Après-midi
- 13h00 – 13h40 : Keynote – Apprentissage continu pour le rubricage d’articles de presse, Corentin BLANC (ContentSide)
- 13h45 – 14h15 : Communication – Amélioration de la Construction de Graphes de Connaissances Indépendants du Domaine grâce au Nettoyage des OpenIE et à la Validation par LLMs, Othmane KABAL, Mounira HARZALLAH, Fabrice GUILLET
- 14h15 – 14h30 : Pause café
- 14h30 – 15h00 : Communication – CryptoGPT : un modèle 7B rivalisant avec GPT-4 dans la tâche d’analyse et de classification des actualités financières en temps réel – L’impact de l’Annotation Automatique et du Fine-Tuning Stratégique via QLoRA, Ying ZHANG, Matthieu PETIT GUILLAUME, Aurélien KRAUTH, Manel LABIDI
- 15h00 – 15h30 : Communication – Extraction d’informations appliquée aux documents non-structurés pour la valorisation de périodiques historiques : application au patrimoine de la région Bourgogne Franche-Comté en France, Nicolas GUTEHRLE, Iana ATANASSOVA
- 15h30 – 16h00 : Communication – Konwledge Graph Construction Using Large Language Models, Yassir LAIRGI, Ludovic MONCLA, Rémy CAZABET, Khalid BENABDESLEM
- 16h00 – 16h30 : Fair Text Classification with Wasserstein Independence, Thibaud LETENO, Antoine GOURRU, Charlotte LACLAU, Rémi EMONET, Christophe GRAVIER
- 16h30 : Fin de la journée