Projet SCRIBO
HR-Noyau
Extraction des chemins syntaxiques de relations
avec acquisition semi-supervisée de relations et de patrons de relations entre entités nommées
[Index]
Description
HR-Noyau construit à partir de résultats d'analyse syntaxique en dépendance des arbres syntaxiques. Dans les arbres, il repère ensuite tous les couples d'ENs ainsi que les chemins qui les relient, que nous appelons chemins syntaxiques de relations. Le système regroupe ensuite les couples d'ENs reliés par le même chemin et les chemins reliant le même couple d'ENs.
HR-Noyau comporte également une fonction d'acquition de relations permettant d'extraire des relations et des patrons de relations entre entités nommées. La première version de cette fonction est réalisée par une méthode semi-supervisée. Sans aucun patron prédéfini, le système fournit des chemins syntaxiques susceptibles de représenter une relation donnée à l'aide de quelques exemples de couples d’entités nommées entretenant la relation en question.
Programme HR
- Fichier Zip contenant différents codes écrits en C++ et le fichier projet Xcode (.xcodeproj).
- Commande d'exécution : HR Fichier_source Type_EN1 Type_EN2 semi Fichier_ex_paires
ex. extraire à partir du corpus "Test.txt" les paires Individu-Organisation, instances de la relation d'appartenance, à l'aide des exemples paires contenus dans le fichier "exemples.txt" :
HR Test.txt indivual organization semi exemples.txt
Résultat d'expérience
Information sur le corpus
- Dépêches AFP du 20/05/2009 au 29/07/2009 (2 mois)
- Résultats d'analyse syntaxique en dépendance au format Passage
- Fichier après "pré-traitement" (format simplifié dans un seul fichier) : afp0520_0729.xml (téléchargez ou affichez le code source pour visualiser)
Liste des Fichiers Résultats
- Fichier Phrases
- Liste des couples ENs Organisation-Organisation avec leurs chemins de relations
- Ftmp_OrgOrg.xml
tous les couples d'entités nommées du type Organisation-Organisation avec tous les chemins les reliant
- Liste des couples ENs Individu-Individu avec leurs chemins de relations
- Ftmp_IndInd.xml
tous les couples d'entités nommées du type Individu-Individu avec tous les chemins les reliant
- Index de tous les couples ENs avec leurs chemins de relations
- Index de tous les chemins avec les couples ENs qu'ils relient
Résultat d'extraction : relation d'appartenance
- Couples ENs en relation d'appartenance
- afp0520_0729_resultat.xml (résultat non vérifié)
tous les couples extraits à partir du corpus avec une méthode semi-supervisée (voir "Publications")
Publications
- Yayoi NAKAMURA-DELLOYE et Éric VILLEMONTE DE LA CLERGERIE (2010). Exploitation de résultats d’analyse syntaxique pour extraction semi-supervisée des chemins de relations, TALN 2010, Montréal (Canada), PDF
- Yayoi NAKAMURA-DELLOYE (2010). Extraction des chemins entre deux entités nommées en vue de l’acquisition des patrons de relations, IC 2010, Nîmes (France), PDF
Créé le 30 juin 2010
Yayoi NAKAMURA-DELLOYE