Help:Corpus Management Application

Traitement de corpus

Service de requête

Langage DPath

Vue d'ensemble de la syntaxe

Une version du langage dpath permet la recherche de résultats d'analyse selon la syntaxe suivante.

Une requête est constituée d'une disjonction (OR) ou conjonction (AND) d'expressions.

Une expression commence nécessairement par l'un des 3 points de départ suivant :

  • nodes : sélectionne tous les noeuds du graphe

  • edges : sélectionne tous les arcs du graphe

  • roots : sélectionne toutes les racines du graphe (plusieurs possible si le graphe est une conjonction d'analyses partielles)

Ce point de départ forme la sélection courante qui va être modifiée à l'aide de 3 types d'opérateurs :- navigation, test, filtre. Chaque opérateur produit une nouvelle sélection.

La navigation produit une nouvelle sélection selon différents axes.

A partir d'une sélection de noeuds :

  • out : produit l'ensemble des arcs sortants de la sélection courante

  • in : produit l'ensemble des arcs entrant la sélection courante

  • prev : produit l'ensemble des noeuds qui précèdent ceux de la sélection courante

  • next : produit l'ensemble des noeuds qui suivent ceux de la sélection courante

  • parents : produit l'ensemble des noeuds ancêtre de ceux de la sélection courante

  • children :produit l'ensemble des noeuds descendants de ceux de la sélection courante

A partir d'une sélection d'arcs

  • target : produit l'ensemble des noeuds de sortie des arcs de la sélection courante

  • source : produit l'ensemble des noeuds d'entrée des arcs de la sélection courante

Le test permet de tester la sélection sur différentes propriétés et de filtrer les éléments réussissant le test selon le format suivant :

[attribut_ou_fonction : "valeur"]

Les attribut que l'on peut tester sont par exemple le label d'un arc ou d'un noeud, la catégorie syntaxique (pos ou cat selon le format d'analyse du corpus) d'un noeud, etc. La complétion automatique permet de proposer les attributs et ensembles de valeurs possibles pour un test.

En plus des attributs, on peut appliquer les fonctions suivantes :

  • ein : pour tester le nombre d'arcs entrant d'un noeud

  • eout : pour tester le nombre d'arcs sortant d'un noeud

  • dir : pour tester la direction d'un arc où les valeurs sont "left" pour un arc allant vers la gauche ou "right" pour un arc allant vers la droite

Il est ensuite possible de filtrer la sélection courante selon les modes suivants :

  • .(sous expression) : garde les éléments dont la nouvelle sélection dérivée n'est pas vide

  • a(sous expression) : garde tous les éléments si et seulement si tous produisent une nouvelle sélection non vide

  • x(sous expression) : garde tous les éléments si au moins une des sélection dérivée n'est pas vide

  • n(sous expression) : garde tous les éléments si l'ensemble des sélections dérivées est vide

Exemples

Il est possible de trouver des examples dans le gestionnaire de macro disponible dans le service de traitement de corpus où le le service de requête.

Gestion de macros

Le gestionnaire de macros permet de créer, enregistrer et partager des requêtes dpath.