Cette page donne accès à un graphe de 23 465 noeuds et 48 819 arcs représentant un réseau lexical acquis sur ALL, un corpus de plus de 700 millions de mots.
#phrases | #mots | #dép. | #formes | #contextes
| ||
Corpus | (millions) | (millions) | Description | (millions) | (milliers) | (millions)
|
Wikipedia (fr) | 18,0 | 178,9 | 504K pages encyclopédiques | |||
Wikisource (fr) | 4,4 | 64,0 | 12.8K textes littéraires | |||
EstRepublicain | 10,5 | 144,9 | journalistique | |||
JRC | 3,5 | 66,5 | directives européennes | |||
EP | 1,6 | 41,5 | débats parlementaires | |||
Total CPL | 38,0 | 495,8 | lignes précédentes | 169,7 | 1149,3 | 3,7 |
AFP | 14,0 | 248,3 | 400K dépêches de presse | 92,8 | 377,9 | 1,9 |
Total ALL | 52,0 | 744,2 | 262,5 | 1365,8 | 4,6 | |
Les arcs du graphe sont censées traduire une relation de forte similarité sémantique entre 2 mots. Ces similiarités ont été obtenues à partir de dépendances syntaxiques produites par l'analyseur syntaxique FRMG développé par ALPAGE.
Le graphe peut être visualisé grâce à l'outil libre Tulip.
Les principaux contextes explicatifs pour chaise
Un "buisson" autour de la notion de trou
Une partie du réseau sur le corps humain
Quelques sentiments et polysémie/glissement de sens sur divergence
Quelques compositeurs
autour de dépenser et payer
Le réseau vu de loin