Programme

lundi 8 juillet 2024

Heures événement (+)
09:15 - 09:25 Introduction - Organisateurs  
09:25 - 09:40 MeLaSSS : Metric in the Latent Space on Simplified Sentences - Tanguy Herserant, Tristan Luiggi, Laure Soulier, Vincent Guigue: (Institut des Systèmes Intelligents et de Robotique, Sorbonne Université, CNRS)  
09:40 - 09:55 Résumé automatique de textes d'enquêtes judiciaires : retour d'expérience - Thibault Roy (OPPSCIENCE)  
09:55 - 10:20 Évaluation de grands modèles de langue pour la classification de concepts et la génération de descriptions dans les études aréales - Xinyi Shen, Damien Nouvel, Peter Stockinger (LaCAS, INalCO)  
10:20 - 10:35 Pause café  
10:35 - 10:50 Vers une conceptualisation du micro-benchmarking pour l'évaluation des LLM dans un cadre opérationnel - William Babonnaud (Centre recherche et Innovation de Talan)  
10:50 - 11:05 Réflexions pour la conception d'un protocole expérimental de détection des biais dans le triage d'urgence hospitalière à l'aide de modèles de langage - Ariel Guerra-Adames, Marta Avalos, Dalia Cohen, Melissa Davids, Dylan Russon, Océane Doremus, Gabrielle Chenais, Eric Tellier, Cédric Gil-Jardiné, Emmanuel Lagarde (Université de Bordeaux, CHU Bordeaux)  
11:05 - 11:30 Evaluation de Génération de Texte en Domaine Spécifique, Cas d'étude - Ulysse Oliveri, Guillaume Gadek, Alexandre Dey, Arnaud Delhay-Lorrain, Damien Lolive, Benjamin Costé, Bruno Carron, Claude Fendzi, Bruno Grilheres (IRISA, Airbus)  
11:30 - 12:20 Keynote - OpenLLM-France : un projet et une communauté pour développer des LLMs - Jean-Pierre Lorré  
12:20 - 14:00 Déjeuner  
14:00 - 14:15 Challenge - Introduction et annonce du gagnant  
14:15 - 14:25 Challenge - LLM Génératif Zero/Few Shots ou Annotation Manuelle ? Retours d'Expériences du défi EvalLLM 2024 - Maxime Prieur, Sylvain Verdy, Vuth Nakanyseth, Gilles Sérasset, Didier Schwab, Cédric Lopez  
14:25 - 14:35 Challenge - Participation d'OppScience au challenge EvalLLM 2024 : une approche hybride applicable en contexte industriel - Frédérik Bilhaut, David Condaminet, Elias LIMOUNI, Ferial YAHIAOUI, Thibault Roy  
14:35 - 14:45 Challenge - Évaluation des modèles génératifs dans un contexte few-shot ciblant la reconnaissance des entités nommées - Mustapha BENBARKA  
14:50 - 15:00 Challenge - Rapport de Participation de Smart Tribune à EvalLLM2024 : Quelques Usages de LLMs dans l'Univers de la Reconnaissance d'Entités Nommées - Guillaume De Murcia, Ilyas El-Allali, Ludovic Meineri, Laurent Gillard, Samy Lastmann  
15:00 - 15:15 Challenge - CEA-List@EvalLLM2024 : prompter un très grand modèle de langue ou affiner un plus petit ? - Robin Armingaud, Arthur Peuvot, Romaric Besançon, Olivier Ferret, Sondes Souihi, Julien Tourille  
15:15 - 15:30 Challenge - Kairntech à EvalLLM 2024 - Hugo Lafayette, Kévin Deturck, Olivier Terrier  
15:30 - 15:55 Évaluer BLOOM en français - Rachel Bawden, Hatim Bourfoune, Bertrand Cabot, Nathan Cassereau, Pierre Cornette, Marco Naguib, François Yvon, (Inria ALMAnaCH, CNRS IDRIS, CNRS LISN, CentraleSupélec, Université Paris-Saclay)  
16:00 - 16:15 Pause café  
16:15 - 16:30 Utilisation d'un LLM pour le couplage faible de services web - Kevin Séjourné, Alexandru Lata (Cloud Temple)  
16:30 - 16:45 Génération et annotation de corpus pour l'entraînement et l'évaluation de modèles d'extraction de relations : utilisation de bibliothèques de génération de données et de LLMs - Ferial Yahiaoui, Elias Limouni (OPPSCIENCE)  
16:45 - 17:10 Les modèles de langage pour la génération de code tiennent-ils leurs promesses ? - Gaël De Chalendar, Pauline Auda , Jérôme Deshayes-Chaussard, Olivier Ferret, Patrick Hède, Hervé Le Borgne, Adolphe Ngosso Ebene, Ansgar Radermacher, Julien Tourille, CEA-LIST  
17:10 - 17:25 Évaluation des modèles génératifs (LLMs) concernant la détection des problèmes mentaux en basant sur les réseaux sociaux chinois : le cas de l'humeur dépressif - Jinyuan Xu, Tian Lan, Pierre Magistry, Mathieu Valette (ERTIM)  
17:25 - 17:40 Analyse des Métriques de Tokenisation et Leur Corrélation avec les Performances de Traduction Automatique Multilingue - Serge Molina, Josiane Mothe (IRIT)  
Personnes connectées : 1 Vie privée
Chargement...