Atelier sur l'évaluation des modèles génératifs (LLM) et challence d'extraction d'information few-shot

EvalLLM2024 : Atelier sur l'évaluation des modèles génératifs (LLM) et challenge d'extraction d'information few-shot

8-8 juil. 2024 Toulouse (France)

FR EN

Contexte

Les grands modèles de langue (LLM) génératifs se démocratisent et s’intègrent dans des chaines de traîtements de plus en plus complexes, offrant une grande variété de cas d’usage. L’évaluation de ces objets protéiformes pose cependant des problèmes sérieux : les benchmarks existants sont largement anglo-centrés (aussi bien en matière de langue que de culture), parfois eux-mêmes issus de LLM anglo-centrés, et ne couvrent pas forcément l’ensemble des usages. La question de leur évaluation se pose en particulier pour le français et plus généralement pour des langues autres que l’anglais.

Présentation de l'atelier

Dans cet atelier, nous proposons de réunir les chercheuses et chercheurs, industriels et académiques, confrontés aux multiples facettes de l’évaluation des LLM sur des langues autres que l’anglais. Nous sollicitons des propositions de communication sur tous les travaux relevant de ce périmètre.

Une présentation invitée sera donnée par J-P Lorré sur "OpenLLM-France : un projet et une communauté pour développer des LLMs multimodaux souverains"

Voir thèmes, format et calendrier sur la page de soumission.

Date butoir de soumission le 31 mai 7 juin

Contact et comité scientifique

Organisateurs :

Nihel Kooli, DGA MI, Rennes
Vincent Claveau, DGA MI, Rennes
Camille Dutrey, DGA MI, Rennes
Nicolas Diniz, DGA MI, Rennes

Email : dga-mi-event-tal.contact.fct@intradef.gouv.fr

Comité scientifique

Rachel Bawden, Inria
Lucie Chasseur, Inria mission Défense et Sécurité
Caio Corro, Sorbonne Université, CNRS, ISIR
Olivier Ferret, CEA-List
Vincent Guigue, AgroParisTech, UMR MIA-Paris-Saclay
Damien Nouvel, INALCO
Didier Schwab, LIG
Gilles Sérasset, LIG
Karen Fort, LORIA
Fabian Suchanek, Télécom Paris, Institut polytechnique de Paris
François Yvon, ISIR

Vie privée | Accessibilité