| Title: |
Exploration de stratégies de prédiction de la complexité lexicale en contexte multilingue à l'aide de modèles de langage génératifs et d'approches supervisées |
| Authors: |
Kelious, Abdelhak; Constant, Mathieu; Coeur, Christophe |
| Contributors: |
Université de Lorraine (UL); Analyse et Traitement Informatique de la Langue Française (ATILF); Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS); Semantic Analysis of Natural Language (SEMAGRAMME); Centre Inria de l'Université de Lorraine; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD); Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA); Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA); Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-CentraleSupélec-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS); Independent Consultant; Claveau, Vincent; Kooli, Nihel; Poulain, Maxime; Gerardt, Lorenzo |
| Source: |
Actes de l'atelier Évaluation des modèles génératifs (LLM) et challenge 2025 (EvalLLM) ; 20e Conférence en Recherche d’Information et Applications (CORIA) 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 27ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL) Les 18e Rencontres Jeunes Chercheurs en RI (RJCRI) ; https://inria.hal.science/hal-05335579 ; 20e Conférence en Recherche d’Information et Applications (CORIA) 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 27ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL) Les 18e Rencontres Jeunes Chercheurs en RI (RJCRI), 2025, Marseille, France. .... |
| Publisher Information: |
CCSD; ATALA & ARIA |
| Publication Year: |
2025 |
| Collection: |
Université de Lorraine: HAL |
| Subject Terms: |
prompt engineering; apprentissage supervisé; modèles de langage génératifs; multilingue; Complexité lexicale; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] |
| Subject Geographic: |
Marseille; France |
| Description: |
National audience ; Cet article explore des méthodes permettant de prédire automatiquement la complexité lexicale dans un contexte multilingue à l'aide de modèles avancés de traitement automatique du langage naturel. Plus précisément, il étudie l'utilisation de l'apprentissage par transfert et des techniques d'augmentation de données dans un cadre d'apprentissage supervisé, mettant en lumière l'intérêt notable des approches multilingues. Nous évaluons également le potentiel des grands modèles de langage génératifs pour la prédiction de la complexité lexicale. À travers différentes stratégies de requêtage (zero-shot, one-shot et prompts avec raisonnement en chaîne), nous analysons les performances des modèles dans plusieurs langues. Nos résultats montrent que, bien que les modèles génératifs obtiennent des performances prometteuses, leur qualité prédictive reste variable, et les modèles optimisés pour une tâche spécifique continuent de les surpasser lorsqu'ils disposent de données d'entraînement suffisantes. |
| Document Type: |
conference object |
| Language: |
French |
| Availability: |
https://inria.hal.science/hal-05335579; https://inria.hal.science/hal-05335579v1/document; https://inria.hal.science/hal-05335579v1/file/645010.pdf |
| Rights: |
http://creativecommons.org/licenses/by/ ; info:eu-repo/semantics/OpenAccess |
| Accession Number: |
edsbas.8C44C803 |
| Database: |
BASE |