Évolutions du format de sortie

Pour essayer de rendre plus homogènes les configurations et les simplifier, un mécanisme de réécriture de graphe est en cours de développement. Les points principaux concernent:

  • la suppression de la plupart des pseudo-noeuds lexicalement vides, en sélectionnant une tête plausible parmi les noeuds gouvernés par le pseudo-noeud. Par ordre de priorité décroissant, on choisit une tête accessible par un arc de substitution, ou un arc de co-ancrage, ou enfin un arc lexical.
  • la re-routage de certains arcs pour mieux correspondre à des dépendances profondes. Par exemple, le transfert des sujets post-clitiques de l'auxiliaire vers le verbe principal, ou les cas d'extraction de génitif profond dans «il lui coupe les cheveux».
  • le renommage de certains labels, en particulier pour les adjonctions. On peut ainsi envisager de renommer des fonctions syntaxiques en rôles thématiques (par exemple pour le passif).
  • éventuellement, on peut envisager de passer d'arbres de dépendances en graphes de dépendances, en matérialisant, par exemple, des arcs pour le contrôle. Néanmoins, cette évolution amènerait à sortir du cadre du format DepXML.


  • 0
  • 0
Graphe transformé dans en riant, Marie lui a-t-elle coupé les cheveux ?



  • 0
  • 0
Graphe non transformé dans en riant, Marie lui a-t-elle coupé les cheveux ?


Pour l'instant, les transformations entraînent des problèmes avec l'interprétation DepXML, en particulier avec l'idée qu'une dérivation groupe des arcs partant d'un même gouverneur. Pour cette raison, la transformation n'est pas activée par défaut. Elle peut néanmoins être testé en cochant l'option 'transform' dans l'interface de visualisation.