Révisions
// MODIFIER liens sections et adresse parser
Ce document a pour vocation de recenser les phénomènes syntaxiques couverts par FRMG, en les illustrant par des sorties graphiques du format DepXML. Pour l'instant, il s'agit d'un simple document de travail.
1 Introduction
FRMG dénote en premier lieu une méta-grammaire du français, c'est à dire une description haut-niveau des phénomènes syntaxiques (comme la notion de sujet) à l'aide d'une hiérarchie de classes, chaque classe regroupant des contraintes sur les arbres d'analyse. Ainsi, partant d'une classe très générique categories, on construit par raffinement successifs les classes adv pour les adverbes, adv_modifier pour les adverbes actant comme modifieurs, adv_v pour les adverbes modifiant les verbes et adv_before_v pour les adverbes modifiant les verbes en position antéposée, mais aussi adv_adv pour les adverbes modifiant des adverbes, ...
La compilation de cette méta-grammaire par croisement de classes terminales (feuilles pour la hiérarchie de classe) fournit une grammaire TAG à large couverture mais néanmoins compacte en terme de nombre d'arbres, avec actuellement 290 arbres dont 32 ancrables par un verbe. L'utilisation d'une méta-grammaire, et en particulier de son mécanisme d'héritage, permet d'assurer une meilleure cohérence dans la description d'un phénomène syntaxique et de ses variants. Le nom des arbres TAG engendrés comprend le nom des classes utilisées et donne ainsi une indication du ou des phénomènes syntaxiques couverts par un arbre. Néanmoins, de par sa compacité, un arbre (par exemple verbal) peut couvrir de nombreux phénomènes et il n'est pas immédiat de déterminer ce qui est réellement utilisé au niveau d'un mot m, et quels sont les rôles des divers mots en relation avec m.
La vue par dépendance en format DepXML (Section~2) fournie par FRMG permet souvent de distinguer les relations entre les mots de la phrase et les phénomènes syntaxiques sous-jacents. En s'appuyant sur le langage de requête DPath (Section~25), il est possible de définir des motifs fins pour l'extraction d'information ou l'étude de phénomènes linguistiques sur corpus (linguistique de corpus). Néanmoins, il existe une grande diversité de configurations possibles, du fait de la couverture de FRMG, de certaines limitations des grammaires TAGs, et, reconnaissons le, de certains manques de cohérence sur l'ensemble de la grammaire (avec un développement étalé sur plusieurs années).
L'objectif de ce document est donc d'essayer de recenser les divers phénomènes couverts par FRMG en les illustrant par des analyses en dépendances pour des phrases type, de manière à permettre d'identifier la ou les signatures caractéristiques. Les analyses fournies ici peuvent également être obtenue en ligne sur le serveur de parseur à l'adresse http://marc.inria.fr/frmgwiki/frmgparser. Cependant, il est à noter que les analyses attendues pour un phénomène connu de FRMG peuvent être masquées par d'autres analyses concurrentes, suite aux limites du processus de désambiguisation.
- Connectez-vous ou inscrivez-vous pour publier un commentaire