Analysons la phrase suivante : "Le président de la France
aime
la bière mexicaine". On découpe, comme
d'habitude, [Le
président de la France][aime la bière mexicaine],
car on
peut remplacer le premier élément par "il" et le
second
par "dort". On a donc la structure [SN SV]. Si on
s'intéresse au
SN, on va constater que la seule analyse possible est la suivante :
[le][président de la France] (avec les substitutions "ce" et
"ministre"). L'analyse qu'on serait cependant tentée de
faire
serait [le président][de la France]. On pourrait remplacer
"de
la France" par "français" (puisque "le président
français" est une expression bien formée), mais
on ne
pourrait pas trouver d'élément minimal (un mot)
pouvant
être substitué à "le
président" : un pronom
comme "il" ou un nom propre comme "Pierre" donnent des
résultats
inacceptables. Voilà pourquoi on doit accepter la
première analyse, qui a la structure [Dét GN],
où
GN est tout simplement un SN sans déterminant. "Le" n'est
plus
analysable, car c'est un élément minimal. Reste
le GN
"président de la France". Avec les substitutions "ministre"
et
"chinois", on montre que la structure est [président][de la
France], où le deuxième groupe est un syntagme
prépositionnel. Notre analyse a donc jusque ici
mis au
jour la structure suivante : [
P[
SN[
Dét
Le][
GN[
N
président][
SP
de la France]][
SV
aime la bière mexicaine]].
L'analyse du S(yntagme) P(répositionnel) va poser
problème. On peut montrer que "la France" peut
être
remplacé par l'élément minimal "cela".
Cependant,
on ne va pas trouver de mot adéquat pour effectuer une
substitution sur "de". En effet, il s'agit d'une
préposition, et
la classe des prépositions est très restreintes
d'une
part, et d'autre part elle est soumise à des contraintes
très fortes. On doit donc accepter que notre analyse est
bonne,
même si la démonstration n'est pas
complète (en
fait, il est faisable, mais long, de démontrer cela
entièrement). La structure est donc [de][la France]. Reste
à analyser "la France", qui ne pose pas de
problème :
[la][France], où on dira que "France" est un N
même s'il
serait plus juste de dire que c'est un GN.
Le SV s'analyse facilement : [aime][la bière mexicaine]
avec,
comme éléments minimaux pour la substitution
"boit" et
"cela", par exemple. Enfin, "la bière mexicaine" a la
structure
[la][bière mexicaine] (pour la même
raison que
précédemment) avec les substitutions "cette" et
"boisson", et enfin [bière] [mexicaine]. On a donc la
structure
parenthésée suivante :
[
P[
SN[
Dét
Le][
GN[
N
président][
SP
[
P de] [
SN[
Dét
la] [
N France]]]][
SV[
V
aime][
SN[
Dét
la][
GN[
N
bière][
Adj
mexicaine]]]]]
Ce qui se représente quand même beaucoup plus
lisiblement avec l'arbre suivant :
On peut ainsi construire
une
grammaire (c'est-à-dire un ensemble de règles
produisant
une ou des phrase de la langue concernée). Il suffit de
considérer que la notation suivante X => Y Z, qui
signifie
que X a pour constituants immédiats Y suivi de Z. Avec notre
phrase, on aura donc la grammaire suivante :
(1) P => SN SV
(2) SN => Dét GN | Dét N
(3) SV => V SN
(4) GN => N SP | N Adj
(5) SP => Prép SN
Ces cinq règles s'appellent des règles de
réécritures
: le symbole à gauche de la flèche se
réécrit sous la forme des symboles de droite.
Voici
comment elle produit une phrase (je mets à chaque ligne la
règle utilisée pour l'obtenir, et je met en gras
les
éléments qui sont produits par cette
règle) :
P (symbole de départ, dit aussi "axiome")
=> SN SV (par la
règle 1 appliquée à P)
=> Dét
GN
SV (par la règle 2 appliquée à SN,
où on a
choisi de réécrire SN en Dét GN et non
Dét
N - car la barre verticale indique un choix possible entre plusieurs
réécritures)
=> Dét
N
SP SV (par la règle 4 appliquée
à GN, en choisissant la première
possibilité)
=> Dét N
Prép
SN SV (par la règle 5 appliquée
à SP)
=> Dét N Prép
Dét N SV
(par la règle 2 à nouveau appliquée
à SN, mais avec la deuxième
possibilité)
=> Dét N Prép Dét N
V SN (par la
règle 3 appliquée à SV)
=> Dét N Prép Dét N V
Dét GN
(par la règle 2 appliquée à SN)
=> Dét N Prép Dét N V
Dét
N Adj (par
la règle 4 appliquée à GN)
À la dernière ligne, il ne reste plus aucun
élément auquel on pourrait appliquer une
règle. En
effet, Dét, N, Prép, V et Adj n'apparaissent pas
à
gauche d'une flèche dans nos cinq règles. C'est
donc que
la dérivation de la phrase est terminée. Il n'y a
plus
maintenant qu'à remplacer chacun des symboles
(Dét, N,
etc.) par un élément de la classe
d'équivalence
dont ils sont l'étiquette. Donc, sous le premier
Dét, on
peut mettre "le", sous le premier N, on peut mettre
"président",
sous Prép, on met "de", sous le second Dét, on
met "la",
et ainsi de suite, jusqu'à obtenir la phrase qui nous
occupe,
à savoir "le président de la France aime la
bière
mexicaine". Cependant, on aurait aussi bien pu utiliser d'autres mots,
à condition qu'ils appartiennent à la bonne
classe. Pour
le premier déterminant, on aurait pu mettre "un"
plutôt
que "le"; de même, on aurait pu mettre "musicien"
à la
place de "président" pour le premier N, "avec" à
la place
de "de" pour la Prép, "une" pour le second Dét,
"guitare"
pour le second N, "chante" pour le verbe, "une" pour le
troisième déterminant, "chanson" pour le
troisième
N et enfin "folklorique" pour Adj, à la place de
"mexicaine". On
aurait ainsi obtenu la phrase "Un musicien avec une guitare chante une
chanson folklorique", qui a exactement la
même structure que la phrase
précédente.
Notre grammaire nous permet donc de dériver toutes les
phrases
qui ont la même structure syntaxique. Mais, mieux encore,
elle
nous permet de dériver un nombre incalculable d'autres
phrases.
En effet, on peut appliquer les règles en question de la
façon qu'on veut. Par exemple :
P (axiome)
=>
SN SV
(règle 1)
=>
Dét
N SV (règle 2, deuxième
possibilité)
=> Dét N
V
SN (règle 3)
=> Dét N V
Dét
GN (règle 2, première
possibilité)
=> Dét N V Dét
N Adj
(règle 4, deuxième possibilité)
À partir de cette suite de symbole, si on remplace
le
premier Dét par "le", le premier N par "chat", V par
"mange", le
second Dét par "une", le second N par "souris" et enfin Adj
par
"blanche", on obtient la phrase "Le chat mange une souris blanche". On
a donc construit une grammaire de français (partielle, car
on ne
peut pas dériver
toutes
les phrases françaises avec), dans la mesure où
ces
simples règles nous permettent de construire un ensemble
infini
de phrases parfaitement françaises, et de surcroît
il est
impossible de construire une phrase non française avec ces
règles (on peut essayer, on n'y arrivera pas). Il s'agit
donc
d'une description syntaxique (partielle) du français.
Une telle grammaire est dite "générative" (c'est
la
théorie de Noam Chomsky, même si elle a beaucoup
évolué depuis ses origines) dans la mesure
où ces
cinq règles génèrent des phrases : si
on part de
l'axiome P et qu'on suit les règles jusqu'au bout, on
obtient
une phrase du français. L'ensemble des phrases que l'on peut
construire est infini dans la mesure où certaines
règles
forment une boucle. Par exemple, SN peut se
réécrire en
Dét GN (règle 2), où GN peut se
réécrire N SP (règle 4), où
SP se
réécrit Prép SN (règle 5).
Or, à
partir de cette dernière réécriture,
on peut
recommencer au début, puisque le symbole SN
réapparaît, et qu'il peut se
réécrire en
Dét GN, où GN peut se
réécrire N SP, et
ainsi de suite, créant des structures du type :
C'est avec une structure
de ce type
qu'on construire des syntagmes comme "le frère de la
mère
de la voisine...". Il n'y a théoriquement aucune limite
à
ce genre de structures (c'est pourquoi l'ensemble des phrases est
infini). Cependant, on conçoit bien que cela peut devenir
incompréhensible (et de même il est douteux que
cela
puisse être normalement dit par quelqu'un) : "le
frère de
la mère de la voisine du garagiste de l'oncle du patron du
fils
de mon cousin est un type bien". C'est pourquoi il faut faire une
distinction très importante (faite par Chomsky), entre la compétence
et la performance.
La compétence est la capacité abstraite qu'a un
locuteur
à produire des phrases. C'est une partie de sa
faculté de
langage, qui fait qu'il prononce des phrases grammaticales et
reconnaît des phrases agrammaticales (ce qui n'a rien voir,
ne
l'oublions pas, avec la norme qui parle de phrases correctes et de
phrases incorrectes). On peut dire que nos cinq règles
(notre
mini-grammaire du français) sont une
représentation de la
compétence d'un locuteur français
(c'est-à-dire
qu'il fera toutes ses phrases sur ce schéma, et
reconnaîtra comme agrammaticales celles qui ne le respectent
pas).
À l'inverse, la performance est la réalisation en
situation de la parole, soumise à un nombre incalculable de
facteurs : état émotionnel du sujet, fatigue,
bégaiement, etc. La mémoire y joue un rôle
important :
un exemple comme le précédent, quoique
parfaitement
grammatical, sollicite la mémoire à court terme
plus
qu'elle ne peut le supporter, si bien qu'après la
quatrième ou la cinquième préposition,
on ne sait
plus de quoi on parle. C'est là une limitation de la
performance, et pas une limitation de la compétence (qui
pourrait continuer des heures). Le bégaiement, ou la
répétition d'un mot, relèvent aussi de
la
performance. Si je dis "Le... le chat est sorti" (en butant sur le
déterminant pour une raison ou pour une autre), je ne
produis
pas une expression avec deux déterminants à la
suite (la
grammaire n'a donc pas à préciser qu'on peut
faire une
expression de la sorte), je ne fais que
répéter le même. C'est pourquoi on ne
me
répondra pas que je ne parle pas français.
À
l'inverse, si je dis "chat le est sorti" (et que ce n'est pas
simplement ma langue qui fourche), on peut penser que je ne
maîtrise pas le français, et donc que ma
compétence
n'est pas celle d'un locuteur natif.
- Les
propositions subordonnées
Comment analyser une phrase telle que "Le président aime la
bière que le ministre déteste". Intuitivement, on
produirait l'arbre suivant :
Cependant, une telle
analyse pose un
certain nombre de problèmes. D'abord, le verbe
"déteste",
qui prend normalement un objet direct (puisque c'est un verbe
transitif, défini par le contexte |SN (ne) - (pas) SN|),
apparaît ici sans SN à sa gauche. Ensuite, comment
marquer
que ce que le ministre déteste, c'est bien la
bière dont
il est question? Enfin, on rate un aspect essentiel de la
subordination, à savoir la réapparition de la
structure
phrastique : ici, le constituant MODIF (peu importe le nom qu'on lui
donne) a trois constituants immédiats, et sa structure nous
est
inconnue. On peut régler ces divers problèmes en
posant
que la vraie structure de "le président aime la
bière que
le ministre déteste" est la suivante
:
Cette analyse postule qu'il y a un marqueur abstrait de subordination,
noté Q, qui permet de faire
réapparaître la
structure de la phrase (Q a toujours P pour soeur). Par ailleurs, cet
élément Q va chercher un syntagme à
l'intérieur de la phrase ainsi introduite et, en
"fusionnant"
avec lui, produit, dans notre exemple, un pronom relatif, qui
dépend du syntagme en question. Ici, Q s'identifie
à un
objet, d'où "que", mais si ça avait
été un
sujet, ç'aurait été "qui" ("la
personne qui a fait
ça"). Les inconvénients de la
représentation
précédente sont par ailleurs
évités :
"déteste" a bien un objet direct, cet objet est bien la
bière dont il est question, et enfin il est bien
représenté par "que". Par ailleurs, la structure
phrastique est évidente.
Cette analyse n'en est qu'une parmi d'autres, et à vrai dire,
pas
la plus courante, quoiqu'elle soit encore la plus simple à
comprendre. Quelle que soit l'analyse, elle doit rendre compte des
points que nous avons soulevés, et qui se résume
à
: pourquoi et comment se fait-il que "que" soit, dans notre exemple, le
COD de "déteste"? La réponse qu'on apporte par de
telles
représentations doit être
considérée avec
précaution. On constate d'abord que l'arbre que l'on
construit
et l'exemple que l'on étudie ne correspondent plus. En
effet, on
n'a pas l'énoncé "Le président aime la
bière Q (???) le ministre déteste la
bière". Or,
c'est ce qu'on lit si on suit linéairement les feuilles de
notre
arbre. C'est là qu'est le piège : l'arbre
syntaxique ne
représente pas la phrase elle-même, mais est une
représentation condensée des
opérations
syntaxiques nécessaires à la production
d'une telle
phrase. Ces opérations sont-elles mentales, et l'arbre
ci-dessus montre-t-il ce qui se passe dans le cerveau, ou au moins
dans l'esprit humain? Certainement pas : l'arbre est une
représentation (qu'on espère la meilleure
possible) de ce
que l'esprit produit, c'est-à-dire une
représentation du
fonctionnement de la langue, mais pas du fonctionnement de l'esprit
lui-même.
Enfin, on remarque que, de la même manière que le
syntagme
prépositionnel permettait de créer une structure
sans
fin, il en va de même avec la subordination :
puisqu'à
l'intérieur d'une structure P, cette même
structure peut
réapparaître, alors il n'y a
théoriquement pas de
limite à la longueur (et à la profondeur
syntaxique)
d'une phrase. C'est une propriété essentielle du
langage,
à savoir sa
récursivité
: une structure peut apparaître à
l'intérieur
d'elle-même, et ainsi s'étendre à
l'infini.
Cependant, cette propriété relève de
la
compétence, et connaît des restrictions dans la
performance : en général, il est difficile de
comprendre
une structure avec plus de deux propositions relatives
imbriquées. Ainsi, "la personne dont l'ami que j'ai vu hier
m'a
parlé est sympathique" est compréhensible, mais
"la
personne dont l'homme que l'ami que j'ai vu hier déteste m'a
parlé est sympathique" est difficile à entendre,
malgré sa structure tout à fait
régulière
(que j'ai simplifiée, surtout dans la
représentation de
la subordination : je n'ai pas mis l'élément que
le
marqueur Q récupère pour donner un pronom) :
Pour que le sujet de P1
puisse
rencontrer son syntagme verbal, il faut d'abord que P2 passe. Mais pour
que P2 passe (que son sujet et son verbe se réalisent), il
faut
que P3 ait lieu, et pour que P3 ait lieu, il faut d'abord construire
P4. A chaque fois, l'achèvement de la phrase ouverte est
suspendu, si bien que le locuteur doit garder en tête d'abord
que
P1 n'est pas finie, puis que P2 n'est pas finie, et enfin que P3 n'est
pas finie, et quand P4 s'achève, il doit comprendre que ce
qui
arrive va compléter en miroir d'abord P3, puis P2, et enfin
P1.
Enfin, puisque P4 modifie le sujet de P3, qui elle-même
modifie
celui de P2, qui enfin modifie celui de P1, le locuteur doit garder en
tête toutes ces informations pour comprendre exactement P1.