Help:Corpus Management Application
Traitement de corpus
Service de requête
Langage DPath
Vue d'ensemble de la syntaxe
Une version du langage dpath permet la recherche de résultats d'analyse selon la syntaxe suivante.
Une requête est constituée d'une disjonction (OR) ou conjonction (AND) d'expressions.
Une expression commence nécessairement par l'un des 3 points de départ suivant :
nodes : sélectionne tous les noeuds du graphe
edges : sélectionne tous les arcs du graphe
roots : sélectionne toutes les racines du graphe (plusieurs possible si le graphe est une conjonction d'analyses partielles)
Ce point de départ forme la sélection courante qui va être modifiée à l'aide de 3 types d'opérateurs :- navigation, test, filtre. Chaque opérateur produit une nouvelle sélection.
La navigation produit une nouvelle sélection selon différents axes.
A partir d'une sélection de noeuds :
out : produit l'ensemble des arcs sortants de la sélection courante
in : produit l'ensemble des arcs entrant la sélection courante
prev : produit l'ensemble des noeuds qui précèdent ceux de la sélection courante
next : produit l'ensemble des noeuds qui suivent ceux de la sélection courante
parents : produit l'ensemble des noeuds ancêtre de ceux de la sélection courante
children :produit l'ensemble des noeuds descendants de ceux de la sélection courante
A partir d'une sélection d'arcs
target : produit l'ensemble des noeuds de sortie des arcs de la sélection courante
source : produit l'ensemble des noeuds d'entrée des arcs de la sélection courante
Le test permet de tester la sélection sur différentes propriétés et de filtrer les éléments réussissant le test selon le format suivant :
[attribut_ou_fonction : "valeur"]
Les attribut que l'on peut tester sont par exemple le label d'un arc ou d'un noeud, la catégorie syntaxique (pos ou cat selon le format d'analyse du corpus) d'un noeud, etc. La complétion automatique permet de proposer les attributs et ensembles de valeurs possibles pour un test.
En plus des attributs, on peut appliquer les fonctions suivantes :
ein : pour tester le nombre d'arcs entrant d'un noeud
eout : pour tester le nombre d'arcs sortant d'un noeud
dir : pour tester la direction d'un arc où les valeurs sont "left" pour un arc allant vers la gauche ou "right" pour un arc allant vers la droite
Il est ensuite possible de filtrer la sélection courante selon les modes suivants :
.(sous expression) : garde les éléments dont la nouvelle sélection dérivée n'est pas vide
a(sous expression) : garde tous les éléments si et seulement si tous produisent une nouvelle sélection non vide
x(sous expression) : garde tous les éléments si au moins une des sélection dérivée n'est pas vide
n(sous expression) : garde tous les éléments si l'ensemble des sélections dérivées est vide
Exemples
Il est possible de trouver des examples dans le gestionnaire de macro disponible dans le service de traitement de corpus où le le service de requête.
Gestion de macros
Le gestionnaire de macros permet de créer, enregistrer et partager des requêtes dpath.