SÉANCE 10 : L'ANALYSE EN CONSTITUANTS IMMÉDIATS
(suite)


  • Arbre et réécriture

Analysons la phrase suivante : "Le président de la France aime la bière mexicaine". On découpe, comme d'habitude, [Le président de la France][aime la bière mexicaine], car on peut remplacer le premier élément par "il" et le second par "dort". On a donc la structure [SN SV]. Si on s'intéresse au SN, on va constater que la seule analyse possible est la suivante : [le][président de la France] (avec les substitutions "ce" et "ministre"). L'analyse qu'on serait cependant tentée de faire serait [le président][de la France]. On pourrait remplacer "de la France" par "français" (puisque "le président français" est une expression bien formée), mais on ne pourrait pas trouver d'élément minimal (un mot) pouvant être substitué à "le président" : un pronom comme "il" ou un nom propre comme "Pierre" donnent des résultats inacceptables. Voilà pourquoi on doit accepter la première analyse, qui a la structure [Dét GN], où GN est tout simplement un SN sans déterminant. "Le" n'est plus analysable, car c'est un élément minimal. Reste le GN "président de la France". Avec les substitutions "ministre" et "chinois", on montre que la structure est [président][de la France], où le deuxième groupe est un syntagme prépositionnel.  Notre analyse a donc jusque ici mis au jour la structure suivante : [P[SN[Dét Le][GN[N président][SP de la France]][SV aime la bière mexicaine]].

L'analyse du S(yntagme) P(répositionnel) va poser problème. On peut montrer que "la France" peut être remplacé par l'élément minimal "cela". Cependant, on ne va pas trouver de mot adéquat pour effectuer une substitution sur "de". En effet, il s'agit d'une préposition, et la classe des prépositions est très restreintes d'une part, et d'autre part elle est soumise à des contraintes très fortes. On doit donc accepter que notre analyse est bonne, même si la démonstration n'est pas complète (en fait, il est faisable, mais long, de démontrer cela entièrement). La structure est donc [de][la France]. Reste à analyser "la France", qui ne pose pas de problème : [la][France], où on dira que "France" est un N même s'il serait plus juste de dire que c'est un GN.

Le SV s'analyse facilement : [aime][la bière mexicaine] avec, comme éléments minimaux pour la substitution "boit" et "cela", par exemple. Enfin, "la bière mexicaine" a la structure [la][bière mexicaine] (pour la même raison que précédemment) avec les substitutions "cette" et "boisson", et enfin [bière] [mexicaine]. On a donc la structure parenthésée suivante :
[P[SN[Dét Le][GN[N président][SP [P de] [SN[Dét la] [N France]]]][SV[V aime][SN[Dét la][GN[N bière][Adj mexicaine]]]]]   
Ce qui se représente quand même beaucoup plus lisiblement avec l'arbre suivant :




On peut ainsi construire une grammaire (c'est-à-dire un ensemble de règles produisant une ou des phrase de la langue concernée). Il suffit de considérer que la notation suivante X => Y Z, qui signifie que X a pour constituants immédiats Y suivi de Z. Avec notre phrase, on aura donc la grammaire suivante :

(1) P => SN SV
(2) SN => Dét GN | Dét N
(3) SV => V SN
(4) GN => N SP | N Adj
(5) SP => Prép SN

Ces cinq règles s'appellent des règles de réécritures : le symbole à gauche de la flèche se réécrit sous la forme des symboles de droite. Voici comment elle produit une phrase (je mets à chaque ligne la règle utilisée pour l'obtenir, et je met en gras les éléments qui sont produits par cette règle) :

P (symbole de départ, dit aussi "axiome")
=> SN SV (par la règle 1 appliquée à P)
=> Dét GN SV (par la règle 2 appliquée à SN, où on a choisi de réécrire SN en Dét GN et non Dét N - car la barre verticale indique un choix possible entre plusieurs réécritures)
=> Dét N SP SV (par la règle 4 appliquée à GN, en choisissant la première possibilité)
=> Dét N Prép SN SV (par la règle 5 appliquée à SP)
=> Dét N Prép Dét N SV (par la règle 2 à nouveau appliquée à SN, mais avec la deuxième possibilité)
=> Dét N Prép Dét N V SN (par la règle 3 appliquée à SV)
=> Dét N Prép Dét N V Dét GN (par la règle 2 appliquée à SN)
=> Dét N Prép Dét N V Dét N Adj (par la règle 4 appliquée à GN)

À la dernière ligne, il ne reste plus aucun élément auquel on pourrait appliquer une règle. En effet, Dét, N, Prép, V et Adj n'apparaissent pas à gauche d'une flèche dans nos cinq règles. C'est donc que la dérivation de la phrase est terminée. Il n'y a plus maintenant qu'à remplacer chacun des symboles (Dét, N, etc.) par un élément de la classe d'équivalence dont ils sont l'étiquette. Donc, sous le premier Dét, on peut mettre "le", sous le premier N, on peut mettre "président", sous Prép, on met "de", sous le second Dét, on met "la", et ainsi de suite, jusqu'à obtenir la phrase qui nous occupe, à savoir "le président de la France aime la bière mexicaine". Cependant, on aurait aussi bien pu utiliser d'autres mots, à condition qu'ils appartiennent à la bonne classe. Pour le premier déterminant, on aurait pu mettre "un" plutôt que "le"; de même, on aurait pu mettre "musicien" à la place de "président" pour le premier N, "avec" à la place de "de" pour la Prép, "une" pour le second Dét, "guitare" pour le second N, "chante" pour le verbe, "une" pour le troisième déterminant, "chanson" pour le troisième N et enfin "folklorique" pour Adj, à la place de "mexicaine". On aurait ainsi obtenu la phrase "Un musicien avec une guitare chante une chanson folklorique", qui a exactement la même structure que la phrase précédente.

Notre grammaire nous permet donc de dériver toutes les phrases qui ont la même structure syntaxique. Mais, mieux encore, elle nous permet de dériver un nombre incalculable d'autres phrases. En effet, on peut appliquer les règles en question de la façon qu'on veut. Par exemple :

P (axiome)
=> SN SV (règle 1)
=> Dét N SV (règle 2, deuxième possibilité)
=> Dét N V SN (règle 3)
=> Dét N V Dét GN (règle 2, première possibilité)
=> Dét N V Dét N Adj (règle 4, deuxième possibilité)

À partir de cette suite de symbole, si on remplace le premier Dét par "le", le premier N par "chat", V par "mange", le second Dét par "une", le second N par "souris" et enfin Adj par "blanche", on obtient la phrase "Le chat mange une souris blanche". On a donc construit une grammaire de français (partielle, car on ne peut pas dériver toutes les phrases françaises avec), dans la mesure où ces simples règles nous permettent de construire un ensemble infini de phrases parfaitement françaises, et de surcroît il est impossible de construire une phrase non française avec ces règles (on peut essayer, on n'y arrivera pas). Il s'agit donc d'une description syntaxique (partielle) du français.  

Une telle grammaire est dite "générative" (c'est la théorie de Noam Chomsky, même si elle a beaucoup évolué depuis ses origines) dans la mesure où ces cinq règles génèrent des phrases : si on part de l'axiome P et qu'on suit les règles jusqu'au bout, on obtient une phrase du français. L'ensemble des phrases que l'on peut construire est infini dans la mesure où certaines règles forment une boucle. Par exemple, SN peut se réécrire en Dét GN (règle 2), où GN peut se réécrire N SP (règle 4), où SP se réécrit Prép SN (règle 5). Or, à partir de cette dernière réécriture, on peut recommencer au début, puisque le symbole SN réapparaît, et qu'il peut se réécrire en Dét GN, où GN peut se réécrire N SP, et ainsi de suite, créant des structures du type :




C'est avec une structure de ce type qu'on construire des syntagmes comme "le frère de la mère de la voisine...". Il n'y a théoriquement aucune limite à ce genre de structures (c'est pourquoi l'ensemble des phrases est infini). Cependant, on conçoit bien que cela peut devenir incompréhensible (et de même il est douteux que cela puisse être normalement dit par quelqu'un) : "le frère de la mère de la voisine du garagiste de l'oncle du patron du fils de mon cousin est un type bien". C'est pourquoi il faut faire une distinction très importante (faite par Chomsky), entre la compétence et la performance. La compétence est la capacité abstraite qu'a un locuteur à produire des phrases. C'est une partie de sa faculté de langage, qui fait qu'il prononce des phrases grammaticales et reconnaît des phrases agrammaticales (ce qui n'a rien voir, ne l'oublions pas, avec la norme qui parle de phrases correctes et de phrases incorrectes). On peut dire que nos cinq règles (notre mini-grammaire du français) sont une représentation de la compétence d'un locuteur français (c'est-à-dire qu'il fera toutes ses phrases sur ce schéma, et reconnaîtra comme agrammaticales celles qui ne le respectent pas). À l'inverse, la performance est la réalisation en situation de la parole, soumise à un nombre incalculable de facteurs : état émotionnel du sujet, fatigue, bégaiement, etc. La mémoire y joue un rôle important : un exemple comme le précédent, quoique parfaitement grammatical, sollicite la mémoire à court terme plus qu'elle ne peut le supporter, si bien qu'après la quatrième ou la cinquième préposition, on ne sait plus de quoi on parle. C'est là une limitation de la performance, et pas une limitation de la compétence (qui pourrait continuer des heures). Le bégaiement, ou la répétition d'un mot, relèvent aussi de la performance. Si je dis "Le... le chat est sorti" (en butant sur le déterminant pour une raison ou pour une autre), je ne produis pas une expression avec deux déterminants à la suite (la grammaire n'a donc pas à préciser qu'on peut faire une expression de la sorte), je ne fais que répéter le même. C'est pourquoi on ne me répondra pas que je ne parle pas français. À l'inverse, si je dis "chat le est sorti" (et que ce n'est pas simplement ma langue qui fourche), on peut penser que je ne maîtrise pas le français, et donc que ma compétence n'est pas celle d'un locuteur natif.

  • Les propositions subordonnées
Comment analyser une phrase telle que "Le président aime la bière que le ministre déteste". Intuitivement, on produirait l'arbre suivant :



Cependant, une telle analyse pose un certain nombre de problèmes. D'abord, le verbe "déteste", qui prend normalement un objet direct (puisque c'est un verbe transitif, défini par le contexte |SN (ne) - (pas) SN|), apparaît ici sans SN à sa gauche. Ensuite, comment marquer que ce que le ministre déteste, c'est bien la bière dont il est question? Enfin, on rate un aspect essentiel de la subordination, à savoir la réapparition de la structure phrastique : ici, le constituant MODIF (peu importe le nom qu'on lui donne) a trois constituants immédiats, et sa structure nous est inconnue. On peut régler ces divers problèmes en posant que la vraie structure de "le président aime la bière que le ministre déteste" est la suivante :   



Cette analyse postule qu'il y a un marqueur abstrait de subordination, noté Q, qui permet de faire réapparaître la structure de la phrase (Q a toujours P pour soeur). Par ailleurs, cet élément Q va chercher un syntagme à l'intérieur de la phrase ainsi introduite et, en "fusionnant" avec lui, produit, dans notre exemple, un pronom relatif, qui dépend du syntagme en question. Ici, Q s'identifie à un objet, d'où "que", mais si ça avait été un sujet, ç'aurait été "qui" ("la personne qui a fait ça"). Les inconvénients de la représentation précédente sont par ailleurs évités : "déteste" a bien un objet direct, cet objet est bien la bière dont il est question, et enfin il est bien représenté par "que". Par ailleurs, la structure phrastique est évidente.

Cette analyse n'en est qu'une parmi d'autres, et à vrai dire, pas la plus courante, quoiqu'elle soit encore la plus simple à comprendre. Quelle que soit l'analyse, elle doit rendre compte des points que nous avons soulevés, et qui se résume à : pourquoi et comment se fait-il que "que" soit, dans notre exemple, le COD de "déteste"? La réponse qu'on apporte par de telles représentations doit être considérée avec précaution. On constate d'abord que l'arbre que l'on construit et l'exemple que l'on étudie ne correspondent plus. En effet, on n'a pas l'énoncé "Le président aime la bière Q (???) le ministre déteste la bière". Or, c'est ce qu'on lit si on suit linéairement les feuilles de notre arbre. C'est là qu'est le piège : l'arbre syntaxique ne représente pas la phrase elle-même, mais est une représentation condensée des opérations syntaxiques nécessaires à la production d'une telle phrase. Ces opérations sont-elles mentales, et l'arbre ci-dessus montre-t-il ce qui se passe dans le cerveau, ou au moins dans l'esprit humain? Certainement pas : l'arbre est une représentation (qu'on espère la meilleure possible) de ce que l'esprit produit, c'est-à-dire une représentation du fonctionnement de la langue, mais pas du fonctionnement de l'esprit lui-même.

Enfin, on remarque que, de la même manière que le syntagme prépositionnel permettait de créer une structure sans fin, il en va de même avec la subordination : puisqu'à l'intérieur d'une structure P, cette même structure peut réapparaître, alors il n'y a théoriquement pas de limite à la longueur (et à la profondeur syntaxique) d'une phrase. C'est une propriété essentielle du langage, à savoir sa récursivité : une structure peut apparaître à l'intérieur d'elle-même, et ainsi s'étendre à l'infini. Cependant, cette propriété relève de la compétence, et connaît des restrictions dans la performance : en général, il est difficile de comprendre une structure avec plus de deux propositions relatives imbriquées. Ainsi, "la personne dont l'ami que j'ai vu hier m'a parlé est sympathique" est compréhensible, mais "la personne dont l'homme que l'ami que j'ai vu hier déteste m'a parlé est sympathique" est difficile à entendre, malgré sa structure tout à fait régulière (que j'ai simplifiée, surtout dans la représentation de la subordination : je n'ai pas mis l'élément que le marqueur Q récupère pour donner un pronom) :



Pour que le sujet de P1 puisse rencontrer son syntagme verbal, il faut d'abord que P2 passe. Mais pour que P2 passe (que son sujet et son verbe se réalisent), il faut que P3 ait lieu, et pour que P3 ait lieu, il faut d'abord construire P4. A chaque fois, l'achèvement de la phrase ouverte est suspendu, si bien que le locuteur doit garder en tête d'abord que P1 n'est pas finie, puis que P2 n'est pas finie, et enfin que P3 n'est pas finie, et quand P4 s'achève, il doit comprendre que ce qui arrive va compléter en miroir d'abord P3, puis P2, et enfin P1. Enfin, puisque P4 modifie le sujet de P3, qui elle-même modifie celui de P2, qui enfin modifie celui de P1, le locuteur doit garder en tête toutes ces informations pour comprendre exactement P1.

 
ACCUEIL / HOME