Accepted papersPrésentations longuesLes modèles de langage pour la génération de code tiennent-ils leurs promesses ?Gaël De Chalendar, Pauline Auda , Jérôme Deshayes-Chaussard, Olivier Ferret, Patrick Hède, Hervé Le Borgne, Adolphe Ngosso Ebene, Ansgar Radermacher, Julien Tourille, CEA-LIST
Évaluer BLOOM en françaisRachel Bawden, Hatim Bourfoune, Bertrand Cabot, Nathan Cassereau, Pierre Cornette, Marco Naguib, Aurélie Névéol, François Yvon, (Inria ALMAnaCH, CNRS IDRIS, CNRS LISN, CentraleSupélec, Université Paris-Saclay)
Xinyi Shen, Damien Nouvel, Peter Stockinger (LaCAS, INalCO)
Evaluation de Génération de Texte en Domaine Spécifique, Cas d'étudeUlysse Oliveri, Guillaume Gadek, Alexandre Dey, Arnaud Delhay-Lorrain, Damien Lolive, Benjamin Costé, Bruno Carron, Claude Fendzi, Bruno Grilheres (IRISA, Airbus)
Présentations courtesVers une conceptualisation du micro-benchmarking pour l'évaluation des LLM dans un cadre opérationnelWilliam Babonnaud (Centre recherche et Innovation de Talan) Utilisation d'un LLM pour le couplage faible de services webKevin Séjourné, Alexandru Lata (Cloud Temple)
Résumé automatique de textes d'enquêtes judiciaires : retour d'expérienceThibault Roy (OPPSCIENCE)
Réflexions pour la conception d'un protocole expérimental de détection des biais dans le triage d'urgence hospitalière à l'aide de modèles de langageAriel Guerra-Adames, Marta Avalos, Dalia Cohen, Melissa Davids, Dylan Russon, Océane Doremus, Gabrielle Chenais, Eric Tellier, Cédric Gil-Jardiné, Emmanuel Lagarde (Université de Bordeaux Bordeaux population health CHU Bordeaux)
MeLaSSS : Metric in the Latent Space on Simplified SentencesTanguy Herserant, Tristan Luiggi, Laure Soulier, Vincent Guigue: (Institut des Systèmes Intelligents et de Robotique, Sorbonne Université, CNRS)
Génération et annotation de corpus pour l'entraînement et l'évaluation de modèles d'extraction de relations : utilisation de bibliothèques de génération de données et de LLMsFerial Yahiaoui, Elias Limouni (OPPSCIENCE) Évaluation des modèles génératifs (LLMs) concernant la détection des problèmes mentaux en basant sur les réseaux sociaux chinois : le cas de l'humeur dépressifJinyuan Xu, Tian Lan, Pierre Magistry, Mathieu Valette (ERTIM)
Analyse des Métriques de Tokenisation et Leur Corrélation avec les Performances de Traduction Automatique MultilingueSerge Molina, Josiane Mothe (IRIT) |
Online user: 2 | Privacy |