Quelques applications de FRMG

Table of Contents 

Cette page recense quelques exemples d'utilisation de FRMG.

  • Utilisation dans le cadre de l'ANR Rhapsodie pour préparer l'annotation syntaxique de corpus oraux, ainsi que dans le cadre de l'ANR ORFEO sur des corpus écrits et oraux.
  • Utilisation dans le cadre d'une tâche d'extraction de citations dans des dépêches AFP [1]. Démo Sapiens, réalisée en 2010 sur des dépêches concernant la présidentielle de 2007 et ensuite complétée par des dépêches sur la réforme des retraites en 2010. L'idée est de pouvoir chercher qui a dit quoi sur diverses thématiques, en s'appuyant sur une analyse syntaxique avec FRMG de dépêches AFP, puis l'extraction avec DPath de verbes de communications avec ses divers arguments (le sujet/agent, l'objet/thème, l'audience, ...)
  • Utilisation pour le traitement de toutes sortes de corpus, plus ou moins volumineux (comme Wikipedia ou Wikisource), et exploitation des sorties d'analyse syntaxique (en format Passage essentiellement) pour l'extraction de terminologies et la constitution de réseaux de mots (en s'appuyant sur l'hypothèse distributionnelle de Harris) [2] [3] (voir des exemples sur http://alpage.inria.fr/~clerger/wnet/wnet.html et sous l'interface Libellex). Pour l'interface Libellex, on peut se connecter avec l'identifiant guest et passe guest pour ensuite choisir un réseau (par exemple allsement). Pour voir l'ensemble des arcs, cochez "related" dans la tuiles "Options ...".

  • (Sept 2016) Dans la continuité des travaux précédents autour de l'hypothèse distributionnelles, les sorties de FRMG sur gros corpus ont été utilisées pour associer aux mots des vecteurs denses (word embeddings) de dimension entre 100 et 200. L'algorithme utilisé baptisé DepGlove est une variante maison de Glove, lui-même un concurrent du désormais célèbre Word2Vec. La particularité de DepGlove est de s'appuyer sur des chemins syntaxiques issus des formats DepXML ou Passage plutôt que la simple proximité dans la phrase (approche sac-de-mot). Une interface très basique permet de tester ces vecteurs et aussi de les récupérer (au format word2vec). Les vecteurs peuvent aussi être récupérés directement ici.
Capture d'écran de l'interface depglove

Références

  1. É. de La Clergerie, Sagot, B., Stern, R., Denis, P., Recourcé, G., et Mignot, V., « Extracting and Visualizing Quotations from News Wires », in LTC 2009 - 4th Language and Technology Conference, Poznań, Pologne, 2009.
  2. M. Morardo et De La Clergerie, É. Villemonte, « Vers un environnement de production et de validation de ressources lexicales sémantiques », in Atelier TALN 2013 SemDIS, Les Sables d'Olonne, France, 2013.
  3. M. Morardo et De La Clergerie, É. Villemonte, « Towards an environment for the production and the validation of lexical semantic resources », in The 9th edition of the Language Resources and Evaluation Conference (LREC), Reykjavik, Islande, 2014.