ACCUEIL

Note aux participants : N’oubliez-pas de vous inscrire sur le site my GdR (https://mygdr.hosted.lip6.fr/register)

L’École d’été en Traitement Automatique des Langues (ETAL) se déroulera du 12 au 16 juin 2023 au Centre International de Rencontres en Mathématiques (CIRM) à Marseille. Cette école s’adresse aux doctorants, permanents et industriels dans le domaine du TAL et de ses applications. Elle regroupe des cours et des mises en pratique, donnés par des membres de la communauté, sur l’historique du domaine, les modèles actuels ainsi que les enjeux éthiques et sociétaux du TAL.

ETAL est un outil de formation associé au GdR TAL. Cette seconde édition d’ETAL fait suite à celle de 2021 à Lannion qui a été un succès. Elle cible un public provenant de toutes les disciplines connectées au traitement du langage, avec un attachement fort à l’informatique. Cette édition met l’accent sur le lien entre TAL et sciences cognitives dans un contexte multimodal, rassemblant les communautés de l’informatique, des sciences de l’interaction, et des sciences cognitives.

Objectifs

Depuis 2018, la thématique du traitement du langage naturel est (re)-devenue centrale dans le domaine de l’intelligence artificielle, en particulier avec l’émergence des grands modèles de langage comme GPT3 qui ont connu un fort écho tant au niveau de la recherche, que dans le monde socio-économique, en particulier à travers des questions éthiques et sociétales importantes. Ces modèles, fondés sur l’architecture de réseaux de neurones Transformer, sont entraînés de manière auto-supervisée sur de très grandes quantités de textes faisant émerger des propriétés linguistiques et distributionnelles. Ils permettent de cibler de nombreuses applications avec très peu de données annotées. Ces modèles posent de nombreuses questions sur les conditions d’émergence de ces “bonnes” propriétés, sur leur propension à refléter les biais des données dont ils sont issus et sur l’impact énergétique de leur adoption. L’objectif de l’école d’été en Traitement automatique des langues est de donner les clés du domaine aux académiques et industriels pour qu’ils puissent s’attaquer à ces problèmes.

Après une édition 2021 sur les nouvelles interactions pour l’accès à l’information, l’édition 2023 est focalisée sur le lien entre sciences cognitives et traitement du langage naturel, en particulier dans un contexte multimodal. Ces thématiques ont pour objectif de mieux comprendre le développement du langage chez l’être humain et de s’en servir pour informer la construction de systèmes automatiques voués à son traitement.

L’école se fonde sur un socle théorique et pratique permettant aux chercheuses et chercheurs de la communauté de passer d’un niveau introductif ou applicatif, à un niveau avancé, donnant accès aux méthodes actuelles, associées à l’apprentissage profond, à travers une étude de l’historique qui y a donné naissance. Ce socle aborde aussi de manière étendue et pratique les aspects éthiques et sociétaux associés au domaine.

Public ciblé

ETAL se destine prioritairement à des doctorants, chercheurs académiques et industriels possédant un cœur de compétences en informatique, et recherchant une montée en compétences sur les aspects informatiques, linguistiques et méthodologiques liés au traitement du langage naturel. 

L’école d’été ETAL s’adresse également à un public de statisticiens, mathématiciens des données (data scientists), et éventuellement à des chercheurs en sciences humaines et sociales (linguistes, historiens, juristes) ou en traitement des données de santé, ayant de solides compétences en informatique et souhaitant développer leurs connaissances dans le domaine de l’IA pour le TAL.

Intervenants et invités

  • Alexandre Allauzen, PR, Université Paris Sciences et Lettres, ESPCI, UMR LAMSADE : Apprentissage statistique et approches neuronales 1 & 2
  • Yannick Estève, PR, Université d’Avignon, EA LIA : Apprentissage statistique et approches neuronales 1 & 2
  • Benoit Favre, PR, Aix-Marseille Université, UMR LIS : Hackaton
  • Karën Fort, MCF, Sorbonne Université, EA STIH / UMR LORIA : Éthique, reproductibilité, bonnes pratiques du domaine
  • Abdelah Fourtassi, MCF, UMR LIS, Aix-Marseille Université, UMR LIS : Développement du langage et TAL
  • Magalie Ochs, MCF, UMR LIS, Aix-Marseille Université, UMR LIS : TAL Multimodal et interactions
  • Hermann Ney, Professor, RWTH Aachen University of Technology : conférencier invité
  • Laure Soulier, MCF, Sorbonne Université, UMR LIP6 : Apprentissage statistique et approches neuronales 1 & 2
  • Thomas Schatz, MCR, Aix-Marseille Université, UMR LIS : Développement du langage et TAL
  • Xavier Tannier, PR, Sorbonne Université, UMR LIMICS : concepts et méthodologie

Sponsors