Révisions

Le développement manuel de grammaire à large couverture pose d'importants problèmes de maintenance, en particulier dus à la taille des grammaires et à la complexité des structures grammaticales.

Une première solution est d'oublier le coté manuel et de s'orienter vers l'extraction de grammaires stochastiques à partir de treebank (le gros du travail étant reporté sur la constitution du treebank).

Une autre approche, initiée dans les années 90 et début des années 2000, consiste à s'appuyer sur des descriptions modulaires et haut-niveau des phénomènes syntaxiques, sous forme de méta-grammaires. Plutôt que de devoir écrire des structures syntaxiques complètes, qui peuvent déjà mettre en oeuvre plusieurs phénomènes syntaxiques (comme un sujet et un objet dans le cadre d'un verbe à la voie active), une méta-grammaire permet de décrire d'une part la notion de sujet (avec ses divers raffinement), la notion d'objet, la notion de verbe à la voie active, ..... Ces divers notions sont exprimées sous formes de contraintes regroupées en classes. Une classe peut hériter de classes parentes, ce qui permet de raffiner progressivement une notion. Les classes sont également combinables, et à partir de certaines de ces classes combinées dont les contraintes accumulées sont satisfiables, il est possible de produire des structures grammaticales complètes pour un formalisme cible donnée comme les TAGs ou les LFGs.

Les diverses versions des méta-grammaires diffèrent sur les contraintes acceptées, les types d'héritages, les mécanismes de combinaison des classes, et la production des structures grammaticales. Elles ont cependant beaucoup de points communs.

FRMG s'appuie sur une variante de méta-grammaire développée en interne, orientée pour la production de grammaires TAG. Les classes et contraintes peuvent s'écrire sous le format SMG (Simple Meta-Grammar), qui est celui utilisé sur ce wiki pour donner le source des classes.

Composants d'un méta-grammaire

  • Classes

Une méta-grammaire est organisé en une hiérarchie de classe

  1. class adverb {
  2. ...
  3. }
  • Héritage

Une classe peut hériter des propriétés de classes parentes.

  1. <: adverb; %% this class inherits from the adverb class
  2. ...
  3. }
  4. ....
  5. }
  • Contraintes
    • topologiques
      • dominance
      • dominance stricte
      • précédence
    • décorations
      • structures de traits
      • chemins (sur noeuds, classe, et variables)
  • Gardes
  • Ressources (producteur/consommateur)

Une classe peut requérir une fonctionnalité fournie par une autre classes, au travers d'un mécanisme de consommateur/producteur de ressources.

  1. <: adverb;
  2. - x_modifier; # require the functionality "modifier_of_something"
  3. ....
  4. }
  5. class X_modifier {
  6. + x_modifier; # provide the foncionality "modifier_of_something"
  7. ...
  8. }

Ce mécanisme de ressources, puissant, vient en complément de l'héritage. En particulier, une ressource peut être consommée plusieurs fors dans des espaces de noms différents, ce qui n'il n'est pas possible de faire par simple héritage.

Phase de compilation

Production des arbres TAGs


Références

  1. É. de La Clergerie, « From Metagrammars to Factorized TAG/TIG Parsers », in Proceedings of IWPT'05 (poster), Vancouver, Canada, 2005.
  2. É. Villemonte De La Clergerie, « Building factorized TAGs with meta-grammars », in The 10th International Conference on Tree Adjoining Grammars and Related Formalisms - TAG+10, New Haven, CO, États-Unis, 2010.
  3. J. Le Roux, Crabbé, B., et Parmentier, Y., « A constraint driven metagrammar », in Proceedings of the Eighth International Workshop on Tree Adjoining Grammar and Related Formalisms (TAG+8), Sydney, Australia, 2006.
  4. D. Duchier, Le Roux, J., et Parmentier, Y., « XMG: un Compilateur de Métagrammaire Extensible », in Conference Traitement Automatique des Langues Naturelles (TALN'2005), Dourdan, 2005.
  5. B. Gaiffe, Crabbé, B., et Roussanaly, A., « A New Metagrammar Compiler », in Proc. of TAG+6, Venice, Italy, 2002.
  6. M. - H. Candito, « Organisation modulaire et paramétrable de grammaires électroniques lexicalisées », Université Paris 7, 1999.