Révisions

Table of Contents 

L'analyseur FRMG produit par défaut des sorties en dépendances en schéma DepXML, avec des dépendances reflétant directement les structures de la grammaire. Les sorties peuvent être affichées sous forme graphique, mais correspondent en fait à un format XML assez riche [1].

Les sorties peuvent aussi être converties vers d'autres schémas et formats, comme

  • le schéma DepXML en format DepCONLL, un format tabulaire à la CONLL, légèrement étendu pour pouvoir représenter les deux niveaux des tokens et formes

  • 0
  • 0
Graph

Ce schéma DepConll peut bénéficier des simplifications apportées par l'option transform de l'analyseur qui cherche à faire disparaître les noeuds vides (non lexicalisés). Cette option est cependant encore instable !

  • 0
  • 0
Graph

  • le schéma EASy/Passage (associé à un format XML), utilisé lors des campagnes d'évaluation EASy et Passage. Ce schéma s'appuie sur un mélange de 6 types de chunks et de 14 types de relations entre formes ou chunks (voir le manuel d'annotation utilisé dans le cadre du projet PASSAGE)

  • 0
  • 0
Graph

  • le schéma Dépendance FTB, utilisé pour la représentation en dépendances du French Tree Bank (FTB), et représenté par le format tabulaire CONLL (plus d'information sur la page BONSAI d'ALPAGE)

  • 0
  • 0
Graph

  • le schéma Dépendance Sequoia, une variante du schéma précédent, un peu plus précis dans les types de dépendances
  • (nouveau) le schéma Universal Dependency, un format tabulaire (comme CONLL), sous sa forme instanciée pour le français. La conversion vers ce schéma est encore très expérimentale, en particulier du fait que la variante française n'est pas totalement spécifiée.

  • 0
  • 0
Graph


Références

  1. É. Villemonte De La Clergerie, « Convertir des dérivations TAG en dépendances », in 17e Conférence sur le Traitement Automatique des Langues Naturelles - TALN 2010, Montreal, Canada, 2010.