Projet EDyLex
HR-REN
Exploitation des chemins syntaxiques de relations extraits
en vue de la reconnaissance d'entités nommées
[Index]
Description des deux méthodes
HR-REN comporte deux systèmes qui exploitent les chemins syntaxiques de relations extraits par HR en vue de la reconnaissance d'ENs.
Le premier réalise l'identification ou la recatégorisation des ENs en utilisant les chemins de relations comme patrons d'extraction.
Le second système génère des patrons textuels pour la reconnaissance d'ENs à partir de chemins de relations tout en exploitant leurs différents contextes.
Chemins syntaxiques de relations comme patrons pour extraction
- Code Extraction d'ENs
- Liste des patrons
- patrons.txt
ensemble des patrons utilisés pour l'extraction
- chem2pat
script permettant de transformer les chemins de relations extraits par HR (format résultat) en format lisible par "HR-REN"
- Exemples de résultat obtenu
Corpus utilisé : Résultat de l'analyse d'un mois de dépêches AFP (janvier 2007) réalisée par FRMG au format Passage (fichiers fusionnés)
Génération de patrons textuels à partir de chemins de rlations
- Code pour la génération par transformation des chemins
- Patrons textuels obtenus
Corpus utilisé : Résultat d'extraction des chemins syntaxiques de relations fourni par HR (ex. fichiers Classes des relations IND-ORG, IND-COM)
Les fichiers résultats suivants contiennent en début de fichier la liste des chemins utilisés.
Publication
- Yayoi NAKAMURA-DELLOYE (2011). Named entity extraction for ontology enrichment, IPSJ Special Interest Group - Information Fundamentals and Access Technologies (IFAT), Japan.
Créé le 7 juillet 2011
Yayoi NAKAMURA-DELLOYE