Quels analyseurs syntaxiques pour le français ?

ATALA

Journée thématique ATALA
Date: Samedi 10 Octobre 2009
Lieu:Amphi Buffon, Universite Paris 7
Horaire: 9:30 -- 17:00

Nous sommes heureux d'annoncer que l'ATALA met géneureusement en place une offre de bourses pour les étudiants adhérents de l'association souhaitant assister à IWPT'09 et à la journée ATALA.

Les participants sont invités à se faire connaître auprès des organisateurs pour des questions de logistique.

Objectifs

Le projet Technolangue EASy et son successeur le projet ANR Passage ont permis de rendre visible et de faire évoluer les analyseurs syntaxiques du français, au travers des premières campagnes d'évaluation pour le français, en 2004, 2007 et automne 2009.

L'objectif principal de cette journée ATALA, ouverte à tous, est de fournir l'occasion de présenter les approches, techniques et performances des systèmes d'analyse syntaxique du français actuellement disponibles, qu'ils aient ou non participé aux campagnes d'évaluation. La notion de système d'analyse comprend bien sûr les aspects purement syntaxiques mais sans faire l'impasse sur l'ensemble des composants et ressources linguistiques nécessaires à tout système opérationnel et sur les phases amont éventuelles d'apprentissage et de mise au point.

Cette journée aura lieu le 10 Octobre 2009 sur le site de l'université Paris 7, en conjonction avec IWPT'09 (7-9 Octobre), la 11 Conférence internationale sur les technologies d'analyse syntaxique. L'accès à cette journée est libre et gratuit.

Conférencier invité
  • John Carroll -- University of Sussex, Brighton, UK
    Issues in Developing and Distributing a Parser for English: The RASP System

    The first public release of the RASP System was in October 2002; since then RASP has been used in three different scenarios, with differing requirements: (1) as a platform for investigating research questions in parsing, (2) as part of research systems in areas such as ontology and lexicon construction, anonymisation, anaphora resolution, word sense disambiguation, and several forms of text classification, and (3) within commercial applications for sentiment classification, mobile phone-based question-answering, text mining for non-native language learner examination design, and biomedical information extraction. I will talk about our experiences in developing, distributing and supporting RASP over the past several years, addressing important pragmatic issues including modularisation, efficiency, packaging for distribution, input/output formats and encodings, common end-user problems, and evaluation in support of development and cross-system comparison.

Programme
9:20--09:30Remarques d'ouverture
9:30--10:30Présentation invitée par John Carroll
Pause
11:00--11:30L'analyseur syntaxique Fips
Eric Wehrli
article| présentation
11:30--12:00Un point sur les outils du LPL pour l’analyse syntaxique du français
Stéphane Rauzy et Philippe Blache
article| présentation
Déjeuner
13:30--14:00TagParser: combiner un corpus annoté avec un corpus brut
Gil Francopoulo
article| présentation
14:00--14:30Analyse syntaxique du français parlé
Christophe Cerisara et Claire Gardent
article| présentation
14:30--15:00La chaîne d’analyse syntaxique de LEOPAR
Guy Perrier, Bruno Guillaume et Jonathan Marchand
article| présentation
15:00--15:30Une boîte à outils pour développer et utiliser les grammaires de prégroupe
Denis Béchet et Annie Foret
article| présentation
Pause
16:00--16:30Framework modulaire de développement de ressources et d’évaluation diagnostique pour l’amélioration rapide d’un système de TAL
Gaël de Chalendar et Damien Nouvel
article
16:30--17:00 FRMG: évolutions d'un analyseur syntaxique TAG du français
Éric de la Clergerie, Benoît Sagot, Lionel Nicolas et Marie-Laure Guénot
article| présentation
17:00--17:30Discussion
Dates importantes
Date limite de soumission11 Septembre 2009
Date de notification21 Septembre 2009
Date pour les versions finales 1er Octobre 2009
Format des soumissions

Les articles sont limités à une longueur de 8 pages. Les articles peuvent être en français ou en anglais (si aucun auteur n'est francophone).

Les actes seront publiés sous forne électronique sur le site de l'ATALA.

LaTeXWord
iwp09.texiwp09.doc
iwp09french.styiwp09.dot
iwp09.pdfiwp09.pdf
acl.bst

Les soumissions sont à envoyer à Eric de la Clergerie et Patrick Paroubek

Comité de lecture
  • Salah Aït-Mokhtar (XRCE)
  • Philippe Blache (CNRS/Université de Provence)
  • Gael de Chalendar (CEA-LIST)
  • Jacques Chauché (Université de Montpellier II)
  • Gil Francopoulo (TagMatica)
  • Dominique Laurent (Synapse)
  • Alexis Nasr (Université de la Méditerranée, Aix-Marseille 2)
  • Patrick Paroubek (LIMSI)
  • Guy Perrier (LORIA)
  • Owen Rambow (Columbia University)
  • Benoît Sagot (INRIA)
  • Anne Vilnat (LIMSI)
  • Eric Werhli (LATL, Université de Genève)