Plusieurs centaines de fois par jour, nous générons des données qui disent où nous allons, ce que nous faisons, avec qui nous mangeons et ce que nous avons pris comme dessert.
Graph
|
Cette phrase complexe est actuellement mal analysée par FRMG à cause de coordinations sur des arguments phrastiques de "disons" qui sont de natures différentes avec d'une part des interrogratives indirectes (où nous allons, avec qui nous mangeons) et des phrastiques construites sur le pronom "ce" (ce que nous faisons, ce que nous avons pris comme dessert).
Par contre une coordination "régulière" comme la suivante fonctionne correctement, sur des arguments phrastiques d'un verbe comme dire:
Graph
|
Il semble cependant qu'il y a un problème pour les coordinations sur le pronom phrastique "ce", par exemple dans la phrase suivante où les deux occurrences du pronom "ce" devraient être coordonnées.
Graph
|
En conclusion, encore des efforts pour améliorer FRMG
Complément: On peut également se poser la question de la pertinence de Plusieurs centaines de fois par jour attaché comme un modifieur temporel (time_mod), plutôt que comme une forme d'adverbial de fréquence.
« On va vers quelque chose de dangereux », a conclu, inquiet mais sybillin, le patron du MoDem. (Le Monde)
« On va vers quelque chose de dangereux », a conclu, inquiet mais sybillin, le patron du MoDem.
Cette phrase combine une citation (« On va vers quelque chose de dangereux ») comme argument phrastique précédant le verbe de communication "conclure" (arc xcomp), avec un sujet inversé (le patron du MoDem, arc subject). La cerise sur le gâteau vient de l'insertion d'une coordination entre adjectifs (inquiet mais sybillin) positionnée entre le verbe et son sujet (arc vmod). Avec un peu d'aide sur la désambiguisation, l'analyseur FRMG s'en sort, modulo l'ajout de sybillin comme adjectif (car initialement manquant dans le lexique !).
C'est la principale innovation d'Assassin's creed : unity, le dernier-né de la franchise du géant français : un mode multijoueur coopératif dans lequel quatre joueurs peuvent participer à la même mission (Le Monde)
Graph
|
Malheur ! (vendredi 13 oblige) FRMG est dans les choux suite au nom de jeu Assassin's creed : unity qui n'est absolument pas reconnu (en amont de l'analyse syntaxique) comme une entité nommée unitaire et qui pose problème avec des mots anglais, une construction de génitif ('s) et la ponctuation ":". L'analyseur essaie de s'en sortir via une juxtaposition et un clitique reflexif (pour 's) associé à creed "corrigé" en une forme du verbe créer.
À part cela, FRMG reconnait correctement la juxtaposition de 2 phrases (C'est ... français avec un mode ... mission), avec de plus une phrase non verbale (un mode ... mission) et une apposition de le dernier-né de la franchise du géant français sur unity (qui aurait bien sûr était plus correcte sur le nom complet du jeu). On peut aussi apprécier (ou non) la construction "N N" sur "mode joueur" , avec de plus la reconnaissance du préfixe multi- sur joueur. Par contre, le traitement de "dernier-né de la franchise" n'est pas totalement satisfaisant !
On parle souvent de « neutralité du réseau », dont le but est de participer à la liberté de communication et la liberté d’entreprendre. (Blog du Monde)
Graph
|
Outre qu'elle parle d'un sujet important, cette phrase illustre une des limites du formalisme TAG (Grammaire d'Arbres Adjoints) sous-jacent à FRMG. En effet, les mécanismes de combinaison des arbres TAGs, par substitution ou adjonction, ne permettent pas de gérer les extractions profondes comme celle du pronom relatif dont représentant neutralité du réseau qui est ici un modifieur de but. Le mieux que FRMG puisse faire est d'accrocher le pronom sur le verbe est de la relative. Une solution élégante viendrait d'un passage à un formalisme plus puissant comme celui des Multi-Component TAGs (MC-TAGs). Cela devrait finir par arriver :-)
Suffit-il d'avoir le choix pour être libre ? (sujet bac philo 2014)
Graph
|
Ayant le choix, je me garderai bien de disserter sur ce thème ! D'un point de vue strictement syntaxique, FRMG reconnait un sujet impersonnel inversé (avec il) avec un sujet profond "avoir le choix ...", correspondant à une transformation de "avoir le choix suffit pour être libre". Malheureusement, le choix de désambiguisation par défaut préfère accrocher pour être libre sur avoir, ce qui n'est pas totalement impossible mais loin d'être le meilleur choix. Avec les bons réglages de désambiguisation (ci dessous), il est possible d'obtenir la bonne analyse, mais que de choix possibles !
Graph
|
Où l'on trouvera cet argent ne nous paraît pas évident du tout. (Corpus EuroParlement, ep_069.E8504)
Graph
|
Je ne sais si les députés européens ont retrouvé l'argent, mais FRMG n'a pas apprécié la structure de la phrase ! Cette phrase a émergé d'une session de fouille d'erreurs sur les analyses conduites récemment sur le corpus EuroParlement (ainsi que Wikipedia et Wikisource). Dans un premier temps, j'ai pensé à un nouveau cas de relative sans antécédent pour Où l'on trouvera cet argent, sur le modèle de la phrase suivante, titre d'une chanson de Céline Dion (non encore reconnue par FRMG, la phrase pas la chanteuse)
ou l'encore plus classique
Relative sans antécédent dans qui dort dîne.
|
Cependant, après réflexion, il me semble que la phrase illustre en fait un autre phénomène et que le fragment Où l'on trouvera cet argent dénote plutôt une interrogative indirecte utilisée comme sujet, mais peut–être à cause d'une ellipse sur un verbe comme savoir. La phrase serait donc une reformulation de
Graph
|
En tout cas, les avis sur la question sont bienvenus ! (quand aux corpus EuroParlement, Wikipedia, et Wikisource, ils devraient être prochainement disponibles)
Que le réseau social le plus utilisé de la planète débourse la somme colossale de deux milliards de dollars (1,48 milliard d'euros) pour une entreprise si jeune, dont le fondateur présentait ses premiers prototypes au même salon à peine deux ans plus tôt, avait donné à tout le monde de quoi réfléchir sur la portée de tels dispositifs. (Le Monde)
Graph
|
Super longue phrase avec surtout un très long sujet phrastique "Que le réseau social .... deux ans plus tôt," sujet de "avait donné ", correctement reconnu pat FRMG. Cette phrase est également riche de divers phénonènes, comme une extraction profonde "une entreprise ... dont le fondateur" (non reconnu pour des raisons explicité dans un précédent billet), une série de modifieurs sur une expression temporelle (à peine deux ans plus tôt) a peu près correctement traitée par FRMG, et une "relative infinitive" (pas certain de la terminologie) pour "de quoi réfléchir", correctement reconnue mais mal attachée sans aide supplémentaire. Je laisse de coté les habituels problèmes d'attachement !
Au fur te seront les lettres données sans que la suite ne saches et devras les inscrire à la trace. (El levir et le Livre, Alain Damasio)
Graph
|
Cette phrase, à la limite de la grammaticalité, débute la nouvelle "El levir et le Livre" d'Alain Damasio, un écrivain qui aime bien jouer avec la langue (lire en particulier son autre nouvelle "Les Hauts® Parleurs®"). À première vue, FRMG semble s'en sortir assez bien. Mais un examen plus poussé montre que "données" ne peut être reconnu comme verbe principal, ce qui bloque l'accroche de "te" comme objet indirect (preparg). Également, un gros contresens en prenant "la suite" comme sujet de "saches" au lieu d'un objet !
En tout cas, l'occasion pour moi de découvrir que fur est un mot qui a eu une vie avant de devenir un fragment de la locution pléonastique "Au fur et à mesure" (à parcourir sur le Trésor de la Langue Française). J'en profite également pour signaler "Le mot pour la frime", un site consacré aux mots rares.
Fable sur la différence et questionnement sur l'éthique médicale, Des fleurs pour Algernon a reçu de nombreux prix, dont le prestigieux prix Hugo, qui récompense les meilleures œuvres de science-fiction. (Le Monde)
Graph
|
Un pincement au coeur ce weekend avec l'annonce de la disparition de Daniel Keyes, l'auteur de "Des fleurs pour Algernon", dont le souvenir me hante toujours des années et des années après sa lecture. Mais, une fois encore, de nombreux problèmes dans la phrase du jour pour FRMG ! En premier lieu, je réalise que je n'ai toujours pas de classe dans FRMG pour traiter les groupes nominaux comme "Fable sur la différence" utilisé ici de manière flottante comme un adjectif ou une participiale, sur le modèle de la phrase ci-dessous (pour les adjectifs). Ce cas devra être prochainement décrit, mais les limites du phénomènes sont encore un peu floues (a priori, pas de déterminant, et modifieurs obligatoires ?) En tout cas, le problème semble bloquer la reconnaissance comme sujet de Des fleurs pour Algernon (au passage, encore un cas d'entité nommée complexe représentant une oeuvre). Par contre, bonne reconnaissance de "dont le prestigieux prix Hugo" comme une forme de relative non verbale !
Graph
|
Addendum: après quelques tests supplémentaires, il semble que le problème majeur de cette phrase provienne plutôt du fait que "Des fleurs pour Algernon" est vu comme un groupe nominal pluriel qui ne peut donc être sujet d'un verbe au singulier. FRMG dispose d'un mécanisme de relaxation des contraintes d'accord entre un sujet et son verbe, mais celui-ci ne se déclenche que si aucune analyse complète n'est trouvée, et dans le cas présent, il existe de nombreuses analyses, même si de mauvaise qualité ! Encore une fois, on constate l'importance de la reconnaissance des entités nommées (voir la phrase du 13 Juin) et l'utilité des marques de quote. Ceci dit, la partie "Fable sur la différence ..." peut alors être analysée comme un élément flottant de la phrase, mais pas exactement de manière similaire à un adjectif (il faut bien songer à compléter FRMG).
Graph
|
Graph
|
Oser ravir le saumon à l’ours et la ronce aux castors (Blog du Monde)
Graph
|
Aujourd'hui, une phrase superbe et un brin surréaliste qui me permet de mettre en valeur le traitement avancé des ellipses dans les coordinations par FRMG. Ce traitement, fourni par l'option exotic, cherche à établir un parallélisme entre la structure d'analyse à gauche du coordonnant et la structure à droite, quitte à reprendre du matériel à gauche pour l'insérer à droite sous forme d'ellipse. C'est ici le cas pour "Oser" et "ravir" qui sont repris sous forme d'ellipses, permettant d'accrocher les arguments "la ronce" et "aux castors".
Ce n'est pas parce qu'on garde les bêtes dans la montagne à 20 ans qu'on n'a pas de smartphone ou qu'on ne surfe pas sur Internet et les réseaux sociaux. (Le Monde)
Graph
|
Quand le numérique va aux berger tandis que les moutons s'installent sur le site de l'INRIA à Rocquencourt ! Au premier abord, la structure de la phrase ne saute pas aux yeux. En fait, elle illustre un cas de construction clivée en "c'est X que S" appliquée non pas sur un argument mais sur un modifieur, en l'occurrence la subordonnée "parce qu'on garde les bêtes dans la montagne à 20 ans". Mais les phrases sont en général une combinaison de plusieurs phénomènes et c'est le cas ici ! on a en effet une négation dans "Ce n'est pas" et, bêtement, le cas du clitique de négation "ne" n'était pas ici prévu (mais c'est maintenant corrigé). Plus grave, on a aussi une coordination entre "qu'on n'a pas de smartphone" et "qu'on ne surfe pas sur Internet et les réseaux sociaux" qui partage le modifieur "parce qu' ..." et pour l'instant, je ne vois pas de bonne solution pour gérer cette situation. Pour l'instant, le second "que" pour "qu'on ne surfe pas" est vu comme un pronom relatif, ce qui n'est pas une trop mauvaise solution.
Ô Paul, nous n’avions jamais pensé que la victoire ce serait cela. (Charlotte DELBO, Une scène jouée dans la mémoire, Sujet de Français du Brevet 2014)
Graph
|
Déjà le temps du brevet pour ma fille ! ô tempus fugit, et une particule vocative qui met le bazar dans la phrase du jour. Par contre, "la victoire ce serait cela" illustre un cas de "clivée spéciale" (une terminologie maison, faute de mieux, mais je suis preneur d'information !), avec "la victoire" comme sujet profond et "cela" comme attribut (arc comp).
Et si on remplace "Paul" par un nom commun, on obtient globalement une meilleure analyse (mais encore imparfaite).
Graph
|
Se connaître soi-même nécessite une bonne connaissance de soi. (Perles du Bac 2014, Le Monde)
Graph
|
Pas de problème syntaxique particulier, hormis peut-être un sujet phrastique avec "Se connaître soi-même", pour cette perle du bac 2014, dépositrice d'une sagesse ancestrale que n'aurait pas reniée La Palisse
Et pour le plaisir, une seconde perle, réponse poético-métaphorique à notre phrase du 17 Juin:
Notre liberté de choix peut se fracasser devant l'arc-en-ciel de nos émotions.
que peut encore l'enfant, dont le lion lui-même eût été incapable ? (fragment, Ainsi parlait Zarathoustra, Nietzsche)
Graph
|
La phrase complète "Mais dites-moi, mes frères, que peut encore l'enfant, dont le lion lui-même eût été incapable ? " pose des problèmes que je préfère esquiver pour le moment, pour me concentrer sur deux phénomènes. Le premier concerne le fait que "dont" porte sur un argument de "incapable" (incapable de X). FRMG s'en sort très correctement en prenant "incapable" comme tête adjectivale de la phrase. Par contre, l'attachement de la relative "dont le lion lui-même eût été incapable" porte sur sur "enfant", ce qui est incorrect ! On est en fait en face d'une relative disloquée dont l'antécédent est le pronom interrogatif "que". Je connaissais des cas de relatives disloquée portant sur un sujet ("un homme viendra qui mettra fin à nos misères"), mais c'est la première fois que je rencontre le cas d'un pronom interrogatif objet (n'hésitez pas à me proposer d'autres exemples). Mais dans les deux cas, nous sommes malheureusement hors-limites pour les TAGs (voir aussi la phrase du 16 Juin), et il est donc impossible à FRMG de fournir une bonne analyse
Attention, le Nigeria c'est chaud, ils ont des bonnes baskets, c'est les Libanais qui les importent (Coupés du Monde, Blog du Monde)
Graph
|
Intéressante analyse d'une habituée du bar Le Daudet, mais les baskets n'auront manifestement pas suffi pour cette fois ! On peut néanmoins admirer l'abondance de constructions clivées dans cette juxtaposition de phrases, avec une clivée standard dans "c'est les Libanais qui les importent " et une spéciale dans "le Nigeria c'est chaud". Pas de problèmes cette fois pour FRMG !
« Ils », ce sont les zombies, nos plus grands adversaires dans cette course d'orientation nocturne organisée en pleine forêt par deux associations, Balise 77 pour le côté course d'orientation, Z-word production pour le côté zombies. (Blog Le Monde)
Graph
|
Les zombies sont vraiment tendance, semble-t-il ! En témoigne aussi l'arrivée de ZombiLingo, un jeu en ligne pour tester ses compétences grammaticales (si, ça existe !). Si la vie vous pèse, n'hésitez pas !
Sinon, la phrase du jour illustre de nouveau une clivée spéciale (X, c'est Y), avec la particularité de porter sur "ils" comme sujet. Je m'attendais à un échec, mais, en fait, et les quotes ("« ... »") et la majuscule sur "Ils" sauvent la situation. On observe aussi une apposition assez complexe d'une énumération "Balise 77 ..." et "Z-word production ..." sur "associations" qui pose quelques problèmes pour FRMG. Notons enfin que, pour une fois, le nom de l'association "Z-word production" a bien été reconnu comme une entité (et non comme deux mots), mais ce n'est pas le cas pour "Balise 77".
Les expériences menées par ses auteurs ont montré que cette stratégie était payante uniquement si le gardien plongeait 300 millisecondes au moins avant que la chaussure n'entre en contact avec la balle. (Passeur de Science, Blog du Monde)
Graph
|
J'adore ce blog "Passeur de Science" avec son parti pris décalé sur les scientifiques et leurs expériences parfois loufoques. Deux particularités aujourd'hui autour des modifieurs utilisés pour apporter un complément d'information non obligatoire. L'archétype du modifieur dans les théories linguistiques est en général l'adverbe sur le verbe ou l'adjectif sur le nom, mais en fait à peu près toute catégorie de mot est susceptible d'être nuancée par un modifieur. Ici, nous avons "uniquement" venant modifier la conjonction de subordination "si" (petit doute néanmoins sur cette lecture !?), mais surtout l'autre conjonction "avant que" modifiée par la quantité "300 millisecondes", elle-même modifiée par l'adverbial postposé "au moins". À part cela, jour funeste pour les bleus !
il est plus facile pour un chameau de passer par le chas d'une aiguille que pour un riche d'entrer au royaume des cieux (Évangile de Marc, 10,25)
Graph
|
Je viens de retomber par hasard sur cette phrase, tirée des évangiles mais en partie utilisée comme titre de film . Au premier abord, nous avons un bel exemple de comparative (plus X que Y, matérialisé par le lien supermod), retrouvé par FRMG. Mais à y regarder par le chas de l'aiguille, la situation est beaucoup plus complexe. En effet, avec "il est plus facile pour un chameau de passer par le chas d'une aiguille" nous retrouvons le cas d'une phrase adjectivale avec "de passer par le chas d'une aiguille" comme sujet profond (voir ci-dessous et comme illustré dans une phrase du jour du 17 Juin 2014) et malheureusement FRMG n'est pas pour l'instant capable de gérer la combinaison des 2 phénomènes (comparative + phrase adjectivale). Ce point devrait cependant être facilement et prochainement résolu. Mais, plus difficile reste le fait que la comparative porte en fait sur deux arguments de "facile", à savoir "pour un chameau" et "de passer par le chas d'une aiguille", en parallélisme avec "pour un riche" et "d'entrer au royaume des cieux". L'utilisation du mode exotic déjà évoqué pour les cas de coordinations elliptiques (voir aussi la phrase du jour du 24 Juin 2014) pourrait être une bonne piste.
Graph
|