Page web de Benoît Sagot  —  équipe Alpage (Inria / Université Paris 7)

En
Chercheur en TAL (traitement automatique des langues) à l'Inria, directeur de l'UMR-I et équipe-projet Inria Alpage (Inria Paris-Rocquencourt et Université Paris-Diderot Paris 7)
Ancien ingénieur du Corps des Télécommunications (X-ENST)

Thèmes de recherche :

  • Développement de ressources lexicales (morphologiques, syntaxiques, sémantiques), pour le français (lexique syntaxique Lefff, lexique sémantique WOLF) et d'autres langues
  • Morphologie computationnelle et quantitative
  • Analyse syntaxique symbolique (LFG) et probabiliste (PCFG), étiquetage en parties du discours
  • Traitement de corpus bruts (reconnaissance et résolution d'entités nommées, correction orthographique, segmentation non-supervisée…)
  • Grammaires formelles (LCFRS, RCG)
  • Applications du TAL

Coordonnées postales :

UMR-I ALPAGE
UFR de Linguistique de l'Université Paris Diderot
Case 7003
75205 Paris Cedex 13
FRANCE
Tél.: +33 1 39 63 57 01
e-mail :

Activités pour la communauté :

  • Membre du Conseil Scientifique de l'EquipEx Ortolang — 2013–
  • Membre du Conseil Scientifique Restreint (CSR) du LabEx EFL, ancien responsable de l'axe 6 Ressources — 2011–2015, désormais responsable adjoint et membre suppléant du CSR)
  • Membre du Comité de Pilotage du consortium Corpus Écrits de la TGIR Huma-Num
  • Membre du Groupe de Travail Relations Internationales du Conseil d’Orientation Scientifique et Technologique de l'Inria (COST-GTRI)
  • Porteur du projet ANR EDyLex — 2010–2013
  • Membre du Conseil d'Administration et ancien Secrétaire de l'ATALA
  • Évaluateur pour l'ANR
  • Rédacteur en chef invité, avec Núria Bel, d'un numéro de la revue TAL sur les Ressources Linguistiques
  • Organisateur de WoLeR 2011, workshop ESSLLI sur les Ressources Lexicales
  • Membre du comité de programme ou relecteur pour les revues Computational Linguistics, Language Resources and Evaluation, TAL, la session étudiante de LACL 2005, l'atelier sur les formalismes linguistiques de haut niveau de TALN 2007, et les conférences TALN 2008, IIS 2008, ALTW 2008, TALN 2009, ACL 2009, TALN 2010, TALN 2011
  • Relecteur secondaire pour IJCNLP 2005, EACL 2006, TALN 2007 et LREC 2008
  • Membre de comités de recrutement pour différents types de postes d'enseignants-chercheurs ou d'ingénieurs de recherche (3 en 2010, 3 en 2011, 1 en 2012, 1 en 2013, 2 en 2014)
  • De 2007 à 2010, secrétaire de rédaction de la revue TAL

Encadrement :

  • Co-encadrant de la thèse de Marion Baranes (thèse industrielle au sein de l'entreprise viavoo / Université Paris 7, depuis janvier 2012)
  • Co-encadrant de la thèse de Valérie Hanoka (thèse CIFRE Université Paris 7 — Verbatim Analysis, de janvier 2011 à la soutenance en Juillet 2015)
  • Co-encadrant de la thèse de Pierre Magistry (Allocataire Moniteur Université Paris 7, de septembre 2010 à la soutenance en décembre 2013)
  • Co-encadrant de la thèse de Rosa Stern (thèse CIFRE Université Paris 7 — Agence France-Presse, de septembre 2009 à la soutenance en juin 2013)
  • Encadrant du Master 2 de Sarah Beniamine (Université Paris 7, 2014)
  • Examinateur de la thèse de Rania Voskaki (Université Paris-Est Marne-la-Vallée, 2011)
  • Examinateur de la thèse de Claire Mouton (Université Paris Sud, 2010)
  • Examinateur de la thèse de Lionel Nicolas (Université de Nice, 2010)
  • Rapporteur de la thèse de Juan Otero (Université de Vigo, Espagne, 2009)
  • Examinateur de la thèse de Laurence Delort (Université Paris 7, 2008)

Divers :

  • Traducteur (en->fr) de 3 chapitres de la nouvelle édition du Dragon Book (Aho, Lam, Sethi, Ullman)