Visualiser un réseau lexical

Cette page donne accès à un graphe de 23 465 noeuds et 48 819 arcs représentant un réseau lexical acquis sur ALL, un corpus de plus de 700 millions de mots.

#phrases
#mots
#dép.
#formes
#contextes
Corpus
(millions)
(millions)
Description
(millions)
(milliers)
(millions)
Wikipedia (fr) 18,0 178,9 504K pages encyclopédiques
Wikisource (fr) 4,4 64,0 12.8K textes littéraires
EstRepublicain 10,5 144,9 journalistique
JRC 3,5 66,5 directives européennes
EP 1,6 41,5 débats parlementaires
Total CPL 38,0 495,8 lignes précédentes 169,7 1149,3 3,7
AFP 14,0 248,3 400K dépêches de presse 92,8 377,9 1,9
Total ALL 52,0 744,2 262,5 1365,8 4,6

Les arcs du graphe sont censées traduire une relation de forte similarité sémantique entre 2 mots. Ces similiarités ont été obtenues à partir de dépendances syntaxiques produites par l'analyseur syntaxique FRMG développé par ALPAGE.

Le graphe peut être visualisé grâce à l'outil libre Tulip.

Le développement des outils d'acquisition a été faite dans le cadre du projet SCRIBO, financé par le pôle de compétivité SYSTEM@TIC.

Quelques captures d'écran

réseau autour de chaise

traits explicatifs
Les principaux contextes explicatifs pour chaise

zoom buisson
Un "buisson" autour de la notion de trou

corps humain
Une partie du réseau sur le corps humain

sentiments
Quelques sentiments et polysémie/glissement de sens sur divergence

compositeurs
Quelques compositeurs

payer
autour de dépenser et payer

réseau principal
Le réseau vu de loin


Éric de la Clergerie