1. Zellig S. Harris
Mme Françoise Dubois-Charlier
Analyse du discours
In: Langages, 4e année, n°13, 1969. pp. 8-45.
Citer ce document / Cite this document :
Harris Zellig S., Dubois-Charlier Françoise. Analyse du discours. In: Langages, 4e année, n°13, 1969. pp. 8-45.
doi : 10.3406/lgge.1969.2507
http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1969_num_4_13_2507
2. Résumé
L'analyse du discours effectue les opérations suivantes sur tout texte suivi, considéré individuellement.
Elle rassemble les éléments (ou séquences d'éléments) dont les environnements à l'intérieur d'une
phrase sont identiques ou équivalents, et les considère comme équivalents entre eux (c'est-à-dire,
membres de la même classe d'équivalence). Le matériau qui n'appartient à aucune classe
d'équivalence est associé au membre (d'une classe) avec lequel son rapport grammatical est le plus
étroit. On divise les phrases du texte en segments, constitués chacun d'une succession de classes
d'équivalence, de façon à ce que chaque segment obtenu soit aussi semblable que possible, par des
classes qui le composent, aux autres segments du texte. On examine alors la succession des segments
pour repérer la distribution des classes qu'elle offre et, en particulier, pour repérer des schémas
d'occurrence de classes.
Ces opérations ne font appel à aucune connaissance concernant le sens des morphèmes, l'intention de
l'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphèmes, y compris les
junctures de phrase et autres intonations morphologiques (ou ponctuation). L'application de ces
opérations peut être renforcée par l'utilisation des équivalences grammaticales (ou rapports
d'occurrence de morphèmes individuels), tirées de toute la langue ou du corps linguistique dont le texte
en question fait partie. Dans ce cas, il est nécessaire de connaître les classes grammaticales des
différents morphèmes du texte.
L'analyse du discours donne une foule de renseignements sur la structure d'un texte ou d'un type de
texte, ou sur le rôle de chaque élément dans cette structure. La linguistique descriptive, elle, ne décrit
que le rôle de chaque élément dans la structure de la phrase qui le contient. L'analyse du discours nous
apprend, de plus, comment un discours peut être bâti pour satisfaire à diverses spécifications,
exactement comme la linguistique descriptive construit des raisonnements raffinés sur les façons dont
les systèmes linguistiques peuvent être bâtis pour satisfaire à diverses spécifications. L'analyse du
discours donne aussi des renseignements sur des fragments de discours plus longs que la phrase;
ainsi, il se révèle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sont
pas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prédicat, etc.), mais
le sont dans le scheme d'occurrence des classes d'équivalence dans les phrases successives.
3. ZELLIG S. HARRIS
Université de Pennsylvanie
ANALYSE DU DISCOURS *
Cet article présente une méthode d'analyse de l'énoncé suivi (écrit
ou oral) que nous appellerons discours 1. C'est une méthode formelle qui
ne se fonde que sur l'occurrence des morphèmes en tant qu'éléments iso-
lables; elle ne dépend pas de la connaissance que le linguiste qui analyse
peut avoir du sens spécifique de chaque morphème, et elle ne nous apprend
rien de nouveau sur le sens particulier de chacun des morphèmes qui
figurent dans le discours en question. Mais ceci ne signifie nullement que
nous ne puissions pas découvrir autre chose que la manière dont la gram
maire de la langue s'illustre dans ce discours. Car, bien que nous usions de
procédures formelles, proches de celles de la linguistique descriptive,
nous pouvons obtenir sur le texte étudié des renseignements que cette
dernière ne fournissait pas.
Cette information supplémentaire provient d'un fait fondamental :
l'analyse de l'occurrence des éléments dans le texte n'est faite qu'en
fonction de ce texte particulier; c'est-à-dire en fonction des autres éléments
de ce même texte et non en fonction de ce qui existe ailleurs dans la langue.
En conséquence, nous repérons les corrélations spécifiques des morphèmes
du texte tels qu'ils se présentent dans ce texte et, ce faisant, nous décou
vrons quelque chose de sa structure, de ce qui s'y passe. Il se peut que
nous ne sachions pas exactement ce que le texte dit, mais nous pouvons
déterminer comment il le dit — ce que sont les schemes de récurrence des
principaux morphèmes qui le forment.
* Cet article est paru en anglais dans Language, vol. 28, 1952, pp. 1-30. Nous remer
cionsM. Z. Harris et la Société de Linguistique d'Amérique qui nous ont autorisés à le
publier en français.
1. J'ai le plaisir de remercier ici de leur collaboration trois hommes qui m'ont aidé
dans la mise au point de la méthode et dans l'analyse de divers textes : Fred Lukoff,
Noam Chomsky et A. F. Brown. Les recherches antérieures dans la perspective de cette
méthode avaient été présentées par Lukoff dans Preliminary analysis of the linguistic
structure of extented discourse (University of Pennsylvania Library [1948]). Une analyse
détaillée d'un texte-échantillon a paru dans « Discourse analysis : a sample text » de
Z. Harris, Language, vol. 28, n° 4, 1952, p. 474.
4. 9
On peut déterminer des schemes définis pour des textes donnés, pour
des individus, des styles ou des thèmes donnés. Dans certains cas on peut
tirer des conclusions formelles du scheme spécifique de distribution des
morphèmes dans un texte. Et il est souvent possible de mettre en évidence
des différences de structure régulières entre les discours tenus par des
personnes différentes, ou dans des styles ou sur des thèmes différents.
Préliminaires
1. — Le problème.
On peut envisager l'analyse du discours à partir de deux types de
problèmes qui, en fait, sont liés. Le premier concerne le prolongement de
la linguistique descriptive au-delà des limites d'une seule phrase à la fois.
Le second concerne les rapports entre la « culture » et la langue (c'est-à-dire
entre le comportement non-verbal et le comportement verbal).
Le premier problème se pose parce que la linguistique descriptive
s'arrête généralement aux limites de la phrase. Ceci ne résulte pas d'une
décision a priori, car les techniques linguistiques ont été élaborées pour
permettre d'étudier tout énoncé, quelle qu'en soit la longueur; mais il se
trouve que, dans toutes les langues, presque tous les résultats obtenus
concernent un type d'énoncé relativement court qu'on peut appeler phrase.
Autrement dit, quand on établit une interdépendance dans l'occurrence
de deux éléments A et B, il se trouve presque toujours que ces deux él
éments sont considérés comme se présentant dans une même phrase. On
peut dire, par exemple, que les adjectifs anglais se trouvent avant le nom
ou après certains verbes (dans la même phrase) : the dark clouds, the future
seems bright, mais il est rare que nous puissions établir des interdépen
dances dépassent les limites de la phrase, par exemple si le verbe
qui
principal d'une phrase a tel suffixe de temps, le verbe principal de la
phrase suivante aura tel autre suffixe de temps. Nous ne pouvons pas dire
que, si une phrase est; de la forme NV, la suivante sera de la forme N.
Tout ce que nous pouvons dire, c'est que la plupart des phrases sont de
la forme NV, que quelques-unes sont de la forme N, etc., et que ces
structures figurent dans diverses séquences.
C'est ainsi que la linguistique descriptive, partie pour décrire les
occurrences d'éléments dans tout énoncé quelle qu'en soit la longueur,
les décrit finalement surtout en fonction des autres éléments de la même
phrase. On ne s'est pas trop inquiété de cette limitation, parce qu'elle
n'a pas empêché l'élaboration de grammaires adéquates : la grammaire
expose la structure des phrases; le locuteur construit chaque phrase par
ticulière conformément à cette structure et produit sa propre séquence
de phrases.
L'autre problème, celui des rapports entre le comportement (ou
5. 10
situation sociale) et la langue, a toujours été considéré comme extra
linguistique. La linguistique descriptive ne se préoccupe pas du sens des
morphèmes et, bien qu'on puisse essayer de tourner la difficulté en parlant,
non de sens, mais de la situation sociale et intersubjective dans laquelle
l'énoncé est produit, la linguistique descriptive n'est pas armée pour tenir
compte de la situation sociale : elle peut seulement définir l'occurrence
d'un élément linguistique en fonction de l'occurrence d'autres éléments
linguistiques. Les études menées sur les rapports entre la « culture » et la
langue n'ont donc pas pu bénéficier des travaux distributionnels récents.
Ainsi, elles font l'inventaire des sens exprimés dans la langue en étudiant
le stock lexical; ou elles tirent des conclusions du fait que, dans une cer
taine langue, un certain groupe de sens s'exprime par le même morphème;
ou elles discutent des nuances de sens et d'emploi d'un mot en le rappro
chantd'autres (par exemple en stylistique). Elles ont aussi souligné cer
tains points comme le fait qu'il faut considérer le sens global des syn-
tagmes et non la somme des sens des morphèmes qui les constituent :
ainsi « How are you? » est une formule de politesse plutôt qu'une question
sur la santé de l'interlocuteur. Cet exemple illustre bien la corrélation
entre le discours et la situation sociale. De même on a étudié des caracté
ristiques de la personnalité dans l'énoncé en rapprochant les traits li
nguistiques récurrents d'un individu avec des traits récurrents de son
comportement et de sa sensibilité 2.
2. — Distribution a l'intérieur du discours.
L'analyse distributionnelle ou combinatoire à l'intérieur d'un dis
cours considéré comme un tout spécifique se révèle pertinente pour l'étude
de ces deux problèmes.
D'une part, elle nous permet de dépasser la limitation à la phrase
de la linguistique descriptive. Alors que nous ne pouvons pas définir la
distribution des phrases (ou plus généralement une quelconque relation
entre les phrases) dans un ensemble arbitraire de phrases prises dans une.
langue donnée, nous pouvons obtenir des résultats précis sur certaines
relations dépassant les limites de la phrase si nous ne considérons que les
phrases d'un seul discours suivi, c'est-à-dire celles qui ont été prononcées
ou écrites les unes à la suite des autres par une ou plusieurs personnes
dans une seule situation. Cette limitation de l'analyse au discours suivi
n'en diminue pas l'utilité, puisque toutes les occurrences de la langue ont
une cohérence interne. La langue ne se présente pas en mots ou phrases
2. Nous considérons que les corrélations entre personnalité et langue ne sont pas
simplement liées aux corrélations entre culture et langue, mais qu'elles en sont un cas
particulier. La raison d'être de ce point de vue est que la plupart des caractéristiques
individuelles d'un énoncé (à distinguer des caractéristiques phonétiques) sont en cor
rélation avec les particularités de personnalité qui proviennent de l'expérience de l'i
ndividu dans des situations interpersonnelles conditionnées socialement.
6. 11
indépendantes, mais en discours suivi, que ce soit un énoncé réduit à un
mot ou un ouvrage de dix volumes, un monologue ou une discussion
politique. Les ensembles arbitraires de phrases ne présentent en fait
aucun intérêt, si ce n'est pour vérifier la description grammaticale; et il
n'y a rien d'étonnant à ce que nous ne puissions pas trouver d'interdépen
dance entre des phrases ainsi assemblées. La succession des phrases dans un
discours suivi constitue, au contraire, un domaine privilégié pour les
méthodes de la linguistique descriptive, puisque celles-ci ont pour objet
la distribution relative des éléments à l'intérieur d'un énoncé suivi quelle
que soit sa longueur.
D'autre part, l'analyse distributionnelle à l'intérieur d'un seul dis
cours, considéré individuellement, fournit des renseignements sur certaines
corrélations entre la langue et d'autres formes de comportement. La raison
en est que chaque discours suivi est produit dans une situation précise
— qu'il s'agisse d'une personne qui parle, ou d'une conversation, ou de
quelqu'un qui se met de temps en temps à son bureau pendant un certain
nombre de mois pour écrire un type défini de livres dans une certaine
tradition, littéraire ou scientifique. Cette co-occurrence de la situation et
du discours ne signifie pas, bien entendu, que les discours produits dans
des situations semblables doivent nécessairement avoir certaines carac
téristiques , formelles en commun, ni que les discours produits dans des
situations différentes doivent présenter certaines différences formelles;
elle ne fait qu'expliquer ou permettre l'existence de ces corrélations for
melles.
Il reste à prouver, à partir de données de fait, que ces corrélations
formelles existent bien en effet, que les discours d'un individu, d'un
groupe social, ou relevant d'un style particulier, ou portant sur un certain
thème, , présentent non seulement des significations propres (dans leur
choix des morphèmes), mais aussi des traits formels caractéristiques. Nous
ne parlerons pas ici du choix particulier des morphèmes, mais on peut
étudier les caractéristiques formelles de ces discours par des méthodes
distributionnelles appliquées à l'intérieur de chaque texte; et le fait de
leur corrélation avec un certain type de situation donne un statut de
signification! à l'occurrence de ces caractéristiques formelles.
3. — Combinaison, avec la grammaire.
On voit donc que la méthode présentée ici vient d'une application
des méthodes distributionnelles de la linguistique à un discours à la fois,
considéré comme un tout' spécifique. On peut s'en servir directement sur
un texte, sans faire appel pour son étude à aucune connaissance linguis
tiqueautre que les limites des morphèmes; ceci est possible parce que
l'analyse distributionnelle est une méthode élémentaire, qui consiste sim
plement à établir l'occurrence relative des éléments qui, dans le cas parti-
7. 12
culier, sont des morphèmes. Pour montrer la validité de la méthode, ou
pour pouvoir éventuellement l'appliquer à un matériau non-linguistique,
il convient de n'utiliser aucune autre connaissance préalable que les
limites des éléments.
Si cependant nous nous intéressons non seulement à la méthode,
mais encore à ses résultats, si nous voulons l'utiliser pour découvrir tout
ce qu'il est possible de trouver sur un texte particulier, il est utile de la
combiner avec la linguistique descriptive. Dans ce but, il ne faut utiliser
que les règles de la grammaire de la langue en question qui sont vraies
pour toute phrase ayant une forme donnée. Par exemple, à partir de toute
phrase française de la forme Nj V N2 (Ainsi le chasseur tue le lion), on
peut obtenir une phrase où l'ordre des syntagmes nominaux est inverse
N2 — Nx (le lion — le chasseur) en changeant la forme verbale 3, le lion
est tué par le chasseur. Le recours à ce genre d'informations grammaticales,
dans l'analyse d'un texte, se justifie par le fait que, puisque cette règle
s'applique à toute phrase française de la forme N2 V N2, elle doit donc
aussi être applicable à toute phrase de la forme N-|_ V N2 du texte qui nous
intéresse, à la seule condition, naturellement, que ce soit du français. Et
ce recours à la grammaire permet dans bien des cas de pousser plus loin
l'application de la méthode d'analyse du discours.
Nous verrons ceci plus en détail à la section 7.3.; mais il faut signaler
ici que cet usage de l'information grammaticale ne remplace pas le travail
qui pourrait être effectué par la méthode d'analyse du discours et n'affecte
en rien l'autonomie de cette méthode, il ne sert qu'à transformer certaines
phrases du texte en phrases grammaticalement équivalentes (cf. ci-dessus
la transformation de Nj V N2 en N2 V* Nx), pour rendre plus aisée l'appli
cation de la méthode d'analyse du discours, ou pour la rendre possible
dans certains passages du texte où elle ne l'était pas auparavant. Et nous
verrons qu'il ne s'agit pas de décider arbitrairement quand et comment
appliquer ces transformations grammaticales, mais que c'est la structure
même du texte qui les détermine.
On peut pousser plus avant encore l'application de la méthode d'ana
lyse discours dans des textes particuliers si on utilise, non seulement les
du
résultats ordinaires de la grammaire, mais si on introduit également dans
la linguistique descriptive l'étude des distributions spécifiques des mor
phèmes individuels; dans certains cas, en effet, comme on le verra à la
section 7.3., on aimerait pouvoir avoir des renseignements non plus sur
toute une classe de morphèmes (comme la transformation de tout V en
V*), mais sur un certain membre de cette classe, sur une restriction d'oc
currence qui est vraie pour ce morphème-là, mais non pour les autres; on
n'a pas toujours à l'heure actuelle de tels renseignements, mais il est pos-
3. Dans ce cas de transformation du verbe correspondant à une inversion du sujet
(N1 ci-dessus) et de l'objet (N2), on appellera la nouvelle forme verbale « forme conjointe
de la première » et on l'écrira V*. La forme conjointe d'un verbe actif est donc le passif
et vice versa.
8. 13
sible de les obtenir par des méthodes qui, fondamentalement, sont celles
de la linguistique descriptive.
Enfin, on peut quelquefois pousser plus avant l'application de l'ana
lysedu discours dans des textes particuliers en tirant des renseignements
non seulement de la grammaire de la langue mais aussi d'une analyse des
criptive de l'ensemble, écrit ou parlé, dont le texte fait partie : on peut
considérer cette masse plus vaste de matériau comme le dialecte dans
lequel a été écrit ou dit le texte en question, et on peut dire, comme préc
édemment, que toute conclusion distributionnelle vraie pour toutes les
phrases d'une forme donnée dans ce dialecte est vraie aussi de toute phrase
de cette forme dans le texte en question.
La méthode
4. — Nature de la méthode.
Nous avons soulevé deux questions : celle des rapports distribution-
nels entre les phrases, et celle de la corrélation entre la langue et la situa
tion sociale. Nous avons suggéré qu'on peut obtenir des renseignements
concernant ces deux problèmes grâce à l'analyse formelle d'un discours
pris comme un tout spécifique. Quel genre d'analyse faudrait-il utiliser?
Pour en décider, considérons ce que permet le matériau.
Puisque le matériau consiste simplement en une séquence de formes
linguistiques disposées en phrases successives, toute analyse formelle se
limite à localiser des éléments linguistiques à l'intérieur de ces phrases,
c'est-à-dire à établir les occurrences d'éléments; à moins d'introduire de
l'extérieur des informations nouvelles, nous ne pouvons pas étudier la
nature ou la composition de ces éléments, où leur corrélation avec des
caractéristiques non-linguistiques.
Qui plus est, il n'y a pas d'éléments spéciaux qui soient a priori plus
importants que les autres, comme mais, ou je, ou communisme, qui nous
conduiraient à nous intéresser au simple fait de leur absence ou de leur
présence dans notre texte. Toute analyse qui tendrait à découvrir la pré
sence ou l'absence dans un texte de certains mots particuliers choisis par
le linguiste, serait une recherche sur le contenu du texte, qui reposerait
finalement sur le sens des mots choisis. Si nous ne nous appuyons pas sur
le sens dans notre analyse, les seuls morphèmes — ou les seules classes —
que nous puissions traiter séparément sont ceux qui présentent des parti
cularités de distribution établies grammaticalement.
Puisque nous ne nous intéressons donc pas, en général, à tel ou tel
élément choisi à l'avance, mais bien aux éléments qui figurent dans le
texte, il est évident que nous ne voulons pas simplement affirmer tauto-
9. 14
logiquement qu'ils figurent; nous chercherons à établir empiriquement
comment ils figurent, — lesquels se trouvent toujours à côté de quels
autres, ou dans le même environnement que quels autres, etc., — c'est-
à-dire l'occurrence relative de ces éléments les uns par rapport aux autres»
En ce sens notre. méthode se rapproche» plus de celle queJ!on< utilise pour
élaborer la grammaire d'une langue (qui établit; les. rapports distribution-
nels entre les .éléments), que de celle que l'on (utilise pour en j élaborer le
• dictionnaire (qui dresse la liste de tous les éléments de cette langue, sans se
préoccuper de, leurs .positions).
Enfin, puisque, le matériau est une suite -finie de. phrases, ce que nous
aurons établi sur la distribution.de chaque élément ne peut être valable que
dans les limites de cette séquence de phrases — que ce soit un paragraphe
ou un livre. Nous verrons plus loin (7.3.) qu'on peut parfois utiliser des
renseignements concernant la distribution d'un élément hors du texte consi
déré; mais ceci ne peut être qu'un auxiliaire extérieur, à n'utiliser que
lorsque la distribution de cet élément dans le texte a été complètement
établie.
5. — Aperçu général de la méthode.
Il résulte de tout ce qui précède que notre méthode devra établir
les occurrences d'éléments et en particulier les occurrences relatives de tous
les éléments d'un discours dans les limites de ce seul discours.
5.1. Éléments dans des environnements identiques.
Pour satisfaire à cette nécessité, nous pourrions. formuler de façon
détaillée la distribution de chacun des éléments dans le discours — de
même qu'en linguistique descriptive nous pourrions établir des formules
individuelles rendant compte de tous les environnements (c'est-à-dire de
la distribution) de chaque élément dans les différentes phrases d'une
langue. Mais ces formules individuelles sont de dimension impossible
pour toute une langue et, même pour un seul texte, elles sont difficiles
à manier. De plus, dans les deux cas, elles ne constituent pas une base
satisfaisante pour procéder à une analyse comparée et pour en déduire des
conclusions générales. C'est pourquoi, dans l'analyse du discours, comme
en linguistique descriptive, on regroupe les éléments qui ont des distribu
tions semblables en une classe et, à partir de là, on parle de la distribution
de la classe considérée comme un tout plutôt que de celle de chacun des
éléments pris séparément.
Quand deux éléments ont des distributions identiques, cette opération
de regroupement ne présente aucune difficulté. En linguistique descriptive,
cependant, c'est rarement le cas, car peu de mots ont des distributions
10. 15
identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus fr
équemment dans un texte répétitif, où deux mots peuvent être toujours
employés dans des phrases parallèles identiques — comme par exemple
dans les légendes à style en écho, dans les proverbes, dans les slogans, ou
dans les rapports scientifiques « secs », mais précis.
5.2. Éléments à environnements équivalents.
Il est plus fréquent que deux éléments se présentent dans des env
ironnements qui sont presque identiques, sans l'être tout à fait; nous pour
rons peut-être alors les regrouper en une seule classe distributionnelle
en dressant une chaîne d'équivalences qui lie les deux environnements
presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand
on dit, par exemple, qu'en. français la classe des adjectifs A se rencontre
après la classe des noms N, en dépit du fait qu'un certain A (courageuse
par exemple) peut ne jamais figurer après un certain N (table par exemple).
C'est ce qu'on fait en analyse du discours quand on dit que deux parties
de l'énoncé, qui ont le même environnement à un endroit, sont équivalentes
même en un autre endroit où elles n'ont pas le même environnement.
Supposons par exemple que le texte contienne les quatre phrases
suivantes :
Ici les feuilles tombent vers le milieu de l'automne
Ici les feuilles tombent vers la fin du mois d'octobre
Les premiers froids arrivent après le milieu de l'automne
Nous commençons à chauffer après la fin du mois d'octobre.
Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre
sont équivalents parce qu'ils se présentent dans le même environnement
(Ici les feuilles tombent vers) et que cette équivalence passe dans les
phrases 3 et 4. Ceci posé, on peut aller plus loin et dire que Les premiers
froids arrivent et Nous commençons à chauffer se présentent dans des env
ironnements équivalents (le mot en supplément après est identique dans
les deux environnements). L'élaboration de ces chaînes, qui font passer
l'équivalence de deux parties de l'énoncé d'une paire de phrases où leur
environnement est vraiment identique, à une autre paire de phrases où
il ne l'est pas, doit naturellement présenter de sérieuses garanties, sinon
tout devient équivalent à tout et l'analyse s'effondre. On a le même pro
blème quand on établit les classes en linguistique descriptive. Nous verrons
plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse
du discours.
De façon plus générale, si nous avons dans notre texte les séquences
4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi
pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le
reste, mais qui contient Jim à la place de Bill.
5. Des travaux inédits de N. Chomsky m'ont aidé à mieux comprendre l'usage de
ces chaînes.
11. 16
AM et AN, nous dirons que M est équivalent à N, ou que M et N se pré
sentent dans un même environnement A, ou que M et N se présentent tous
deux comme l'environnement d'un même élément (ou séquence d'éléments)
A; et nous écrirons M = N. Si nous trouvons alors dans notre texte BM et
CN (ou MB et NC), nous dirons que B est équivalent à C (au second degré),
puisque B et C se trouvent dans des environnements M et N, dont nous
avons établi l'équivalence, et nous écrirons B = C. Puis, si nous trouvons
BK et CL, nous écrirons K = L, puisqu'ils se trouvent dans les environ
nements B et C équivalents au second degré, et ainsi de suite. A titre
d'exemple, continuons notre fragment de texte par la phrase suivante :
Nous avons toujours des tas d'ennuis quand nous commençons à chauffer,
mais il faut bien être prêt quand les premiers froids arrivent. Nous dirons
que Nous avons toujours des tas d'ennuis est équivalent (dans ce texte)
à mais il faut bien être prêt.
Dire que B = C ne veut pas dire qu'ils sont égaux en général, ni qu'ils
signifient la même chose; on utilise le signe = pour l'unique raison que
le rapport entre B et C satisfait aux exigences techniques du rapport
communément symbolisé par ce signe; quand nous posons B = C, cela
signifie seulement que ce rapport est une étape dans une chaîne d'équiva
lencesd'une part B et C se rencontrent dans des environnements équi
:
valents (M et N); d'autre part deux environnements (K et L), quels qu'ils
soient, dans lesquels se trouvent B et G seront considérés équivalents.
Il ne sert à rien de soulever des questions comme « Est-il vrai que
B = C? » ou « A-t-on le droit de dire que K = L, simplement parce qu'on
a B = G et qu'on trouve BK et CL? ». Tout ce que nous proposons ici est
une méthode d'analyse, les seules questions pertinentes sont de savoir
si la méthode est utilisable et si elle conduit à des résultats intéressants
et valables. On jugera si la méthode est utilisable en se fondant sur ses
opérations, sans se préoccuper de ses résultats, que nous n'avons pas
encore vus. Quant aux résultats, nous en étudierons l'intérêt aux para
graphes 8, 9 et 10, où nous verrons que les chaînes d'équivalences révèlent
une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le
« droit » de poser K = L, puisque tout ce que nous signifions par K = L
est qu'on trouve BK et CL et que B = C; la justification viendra du fait
qu'en regroupant toutes les équivalences, on trouve quelque chose sur la
structure du texte.
5.3. Classes d'équivalences.
Après avoir établi quelles sont les séquences qui se rencontrent dans
des environnements équivalents, nous pouvons les regrouper en une seule
classe d'équivalence. Nous avons les formules A = B (tous deux se ren
contrent devant N) et B = C, nous considérerons donc A, B et C comme
membres d'une même classe d'équivalence. De même, M, N, K, L sont tous
membres d'une autre même classe d'équivalence. Reprenons notre
exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent après
12. 17
(To) et Nous commençons à chauffer après (T3) sont tous trois membres d'une
classe d'équivalence T, tandis que le milieu de V automne (Ex) et la fin du
mois d'octobre (E2) sont membres d'une autre classe d'équivalence E. Il
y a encore une troisième classe d'équivalence E' composée de nous avons
toujours des tas d'ennuis quand et mais il faut bien être prêt quand. Il y a
visiblement un rapport entre E' et E puisque tous deux se rencontrent avec
les deux derniers membres de T. Mais E se trouve après T, tandis que
E' se trouve avant T.
En fonction de ces classes, on peut écrire les cinq phrases du fragment
de texte en six formules (la dernière phrase est double) : TE, TE, TE, TE,
E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe,
mais on peut dire que, quand l'ordre de E et T est inversé (quand E se
réfléchit dans T), on a E' à la place de E. Si on modifie les membres de E'
pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le
précéder, ils deviennent des membres réguliers de E. Par exemple, on
pourrait dire Nous commençons à chauffer avec toujours des tas d'ennuis
mais les premiers froids arrivent si brusquement qu'il faut bien être prêt.
Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours
beaucoup d'ennuis est un membre deE en vertu de son occurrence après T;
appelons le E3; il faut naturellement montrer qu'il est équivalent à Nous
avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse
par rapport à T; nous verrons au paragraphe 7.3. à quelles techniques
on fait appel pour établir cette équivalence. De même il faut montrer que
le nouveau syntagme E « mais... si brusquement qu'il faut bien être prêt
(E4) est le réfléchi dans T du syntagme E' mais il faut bien être prêt quand.
Si on peut établir ces deux équivalences, on peut remplacer les deux
syntagmes E' par les syntagmes modifiés qu'on obtient quand on les
met en position E. Nous obtenons par conséquent deux membres de
plus dans E, et la classe E' n'existe plus.
On peut ainsi dresser des classes d'équivalence (comme E) de toutes
les séquences qui ont des environnements équivalents, à l'intérieur du
texte, c'est-à-dire les mêmes classes d'équivalence d'un même côté (avant
ou après). Les éléments (ou séquences d'éléments) qui appartiennent à
la même classe d'équivalence sont dits équivalents les uns aux autres, ou
substituts les uns des autres : nous verrons plus loin (paragraphe 10) que,
par certains côtés (en particulier dans les extensions du texte), on peut les
considérer comme interchangeables ou substituables; dans ce cas la classe
d'équivalence peut aussi s'appeler une classe de substitution.
11 est à remarquer que l'opération consistant à grouper dans une même
classe d'équivalence des formes non identiques, ne repose pas sur le fait
que leurs petites différences de sens sont considérées comme négligeables,
mais sur le fait qu'on les trouve dans des environnements équivalents,
ce qui signifie qu'on les trouve soit dans des environnements identiques
(le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux
dans l'environnement les feuilles tombent vers), soit dans des environne-
13. 18
ments qui sont aux extrémités d'une chaîne d'équivalences garantie
(Les premiers froids arrivent et Nous commençons à chauffer se trouvent
dans les environnments équivalents après le milieu de l'automne et après
la fin du mois d'octobre). Notre méthode est donc essentiellement celle de
la linguistique descriptive et non celle de la sémantique.
5.4. Ordres de phrase.
Nous en arrivons maintenant à une opération que n'emploie pas la
linguistique descriptive, à savoir la représentation de l'ordre des occur
rences successives des membres d'une classe. En linguistique descriptive,
le seul ordre considéré est la position relative des différentes parties d'une
séquence : on décrit, par exemple, l'ordre de l'article et du nom en disant
que le premier précède le second dans la chaîne du syntagme nominal.
Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties
de la phrase, par exemple les ordres différents de E et E' par rapport à T.
L'ordre des phrases successives ou d'une certaine classe de mots dans
différentes phrases (par exemple la relation entre des sujets successifs)
n'intéresse généralement pas la linguistique descriptive, car les formules
distributionnelles qu'elle définit ne s'appliquent normalement qu'à l'inté
rieur d'une seule phrase à la fois. Dans notre cas cependant, où il s'agit de
tout un discours, le problème existe. Si nous considérions chaque phrase
séparément, en ne la rapprochant des autres que pour comparer des struc
tures, nous pourrions dire (comme en linguistique descriptive) que chacune
des phrases de notre fragment de texte consiste en TE. Mais, puisque nous
considérons le texte comme un tout, nous ne pouvons dire qu'il consiste
simplement en 6 fois TE : les membres de E et de T sont différents dans les
diverses phrases; et leurs différences preuvent être particulières à ce texte,
ou à un groupe de texte semblables.
Nous pouvons représenter structurellement notre fragment de texte
par un tableau à double entrée, l'axe horizontal représentant la matière
qui se présente à l'intérieur d'une seule phrase ou sous-phrase, l'axe ver
tical (ici divisé en 2 parties) représentant les phrases successives.
Ti Ex T3 E2
Dans ce tableau à double entrée, les différents symboles dans la rangée
horizontale représentent les différentes parties d'une seule phrase ou
sous-phrase du texte, dans l'ordre dans lequel elles se présentent dans
la phrase (sauf dans la mesure où l'ordre a été modifié par des transfor
mations explicites comme pour le passage de E' à E). Les colonnes verti
cales indiquent les différents membres d'une classe d'équivalence, dans
l'ordre d'apparition des phrases où ils figurent.
Le fait que l'ordre des symboles d'une rangée puisse être différent de
l'ordre des éléments dans la phrase correspondante tient à ce que nos
14. 19
connaissances linguistiques de la structure de phrase nous permettent
de traiter les éléments indépendamment de leur ordre. C'est ce que nous
faisons quand nous ne tenons pas compte dans nos symboles d'un ordre
automatique et qui réapparaîtrait dès la retraduction de nos symboles en
langue, — par exemple nous incluons mais... dans E4 même s'il en est
nécessairement séparé dans la phrase réelle (puisque mais se trouve géné
ralement au début d'une structure de phrase, quelle que soit la partie
de la phrase à laquelle il se rapporte). C'est ce que nous faisons également
quand nous remplaçons un certain ordre non automatique à valeur mor
phologique par les morphèmes qui sont grammaticalement équivalents
à cet ordre : ainsi quand, par exemple, nous remplaçons NXV N2 par
N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tué par
le chasseur) ou quand, dans notre fragment de texte, nous remplaçons
E' avant T par E après T.
Contrairement au traitement cavalier de l'ordre horizontal, nous ne
pouvons rien changer à l'ordre dans une colonne verticale : nous n'avons
là aucune connaissance linguistique a priori qui nous dise quels agence
ments de phrase sont automatiques (s'il y en a) et par conséquent à ne pas
représenter, ni quels agencements peuvent être remplacés par des agen
cements différents, mais équivalents. Une étude plus approfondie des
séquences de phrases dans la langue nous donnera peut-être un jour des
indications à ce sujet; elle établira peut-être, par exemple et pour prendre
un cas très simple, que des séquences de phrases de la forme P parce
que Q sont équivalentes à des séquences de la forme Q donc P, ou que
P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'être
pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une étude
approfondie d'un certain texte ou de plusieurs textes d'un certain type
montrera peut-être que certaines séquences de phrases tout entières
sont interchangeables ou équivalentes; et, grâce à ces données, nous
pourrons peut-être simplifier l'axe vertical du tableau à double entrée,
en trouvant par exemple des schemes verticaux qui reviennent périod
iquement. En attendant, l'axe vertical reste une reproduction exacte
de l'ordre des phrases ou sous-phrases du texte.
5.5. Résumé.
Nous pouvons maintenant avoir un aperçu général de la méthode.
On dira que des éléments (parties de texte — morphèmes ou séquences de
morphèmes) sont équivalents entre eux s'ils se présentent dans l'env
ironnement d'autres éléments identiques ou équivalents. Tout ensemble
d'éléments équivalents entre eux s'appelle une classe d'équivalence.
6. Les mathématiques, et plus encore la logique, ont déjà établi des ordres de
phrase spécifiques qui sont équivalents. On peut redécouvrir linguistiquement cette
équivalence en trouvant que la distribution de chaque phrase est équivalente à celle
des autres. Mais nous cherchons plutôt ici à découvrir d'autres équivalences que celles
que nous savons déjà faire partie du système.
15. 20
Chaque phrase successive du texte est alors représentée par une séquence
de classes d'équivalence, celles auxquelles ses différentes parties appar
tiennent. Nous obtenons ainsi pour tout le texte un tableau à double
entrée, l'axe horizontal représentant les classes d'équivalence contenues
par une seule phrase, l'axe vertical représentant les phrases successives.
Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.),
mais des schemes d'occurrence des classes d'équivalences dans tout le
texte.
Si les différentes phrases contiennent des classes entièrement diffé
rentes, ce tableau n'a pas d'intérêt; mais ce n'est généralement pas le
cas. Il y a, dans presque tous les textes, des passages où certaines classes
d'équivalence se répètent, dans les phrases successives, en un scheme
caractéristique. Le tableau permet d'étudier ce scheme et on peut en
tirer divers types d'information sur le texte, certaines analyses structur
elles texte et certaines exégèses sur le texte. Pour les classes d'équi
du
valence, qui ont été établies distributionnellement, le tableau en montre
la distribution. Pour le texte dans sa totalité, le tableau montre certaines
caractéristiques de structure.
6. — Mode opératoire.
Nous allons maintenant montrer la procédure en détail, en appli
quant la méthode à un texte spécifique, d'un type très courant aujour
d'hui7.
Millions Can't Be Wrong
Millions of consumer bottles of X- have been sold since its introduction
a few years ago. And four out of five people in a nation wide survey say they
prefer X- to any hair tonic they've used. Four out of five people in a nation
wide survey can't be wrong. You too and your whole family will prefer X-
to any hair tonic you've used! Every year we sell more bottles of X- to satis
fiedcustomers. You too will be satisfied!
6.1. Détermination des classes d'équivalence.
La première étape dans l'analyse du discours consiste à décider quels
éléments doivent être considérés comme équivalents, donc placés dans la
même colonne du tableau. Ce n'est pas toujours automatique, il ne s'agit
pas simplement de trouver ceux des éléments qui ont des environne-
7. Ceci est le texte authentique d'un slogan, que nous avons trouvé sur une carte,
qui selon toute vraisemblance, était accrochée à une bouteille de lotion capillaire. Un
très grand nombre de slogans ont été analysés, car ils offrent un matériau clair et répét
itif qui est relativement facile à manier, au stade où nous en sommes arrivés dans
l'analyse du discours. On a aussi analysé de nombreux autres types de textes — des
fragments de livres scolaires, de conversations, d'essais littéraires, etc., qui feront l'objet
d'une prochaine publication.
16. 21
ments identiques, car 1° il peut y avoir plusieurs façons de couper une
phrase en parties équivalentes; et 2° il nous faut déterminer dans quelle
direction chercher les chaînes d'équivalence qui sont moins évidentes.
Le point de départ le plus simple est d'examiner les mots du texte
qui sont le plus souvent répétés : presque tous les textes contiennent des
mots très souvent répétés 8, qui sont souvent les mots-clés du texte. On
peut en toute certitude mettre dans une seule colonne, c'est-à-dire dans
une seule classe d'équivalence, les diverses occurrences de chacun de ces
mots. Et on peut mettre dans une seule autre classe d'équivalence les
mots voisins du mot-clé puisqu'ils se présentent dans des environnements
identiques. Dans notre texte, il n'y a pas apparemment de mots-clés;
mais nous pouvons partir de la séquence répétée can't be wrong, identique
et donc naturellement équivalente : Millions est alors équivalent (pour
ce texte) à Four out of five people in a nation wide survey, puisque tous
deux se trouvent devant can't be wrong.
Cette première étape pourrait aussi, bien entendu, être effectuée
pour des mots répétés tels que of. Mais si nous devions regrouper tous les
environnements du mot of, nous ne pourrions pas utiliser la classe d'équi
valence qui en résulterait pour construire une chaîne d'autres équivalences,
car on ne trouverait rien d'autre dans leur environnement. Tandis que
la classe contenant millions et four out of five, que nous obtenons à partir
des répétitions de can't be wrong, se révélera, dans les paragraphes sui
vants, liée à d'autres parties de ce texte.
En utilisant ainsi les répétitions, nous en venons à construire des
chaînes d'équivalence : nous nous demandons quels autres environnements
se présentent pour millions et four out of five... Pour millions nous avons
un autre environnement, à savoir of consumer bottles, etc., mais nous
verrons plus tard (paragraphe 9) que cet environnement s'oppose aux
environnements de four out of five; nous laisserons donc provisoirement
de côté la séquence of consumer bottles, etc. Quant à Four out of five in
a nation wide survey, nous le trouvons dans un autre environnement
say they prefer X- to any hair tonic they 've used.
Nous suivons cette chaîne d'équivalence en cherchant un autre env
ironnement dans lequel say they prefer X- se trouve; il y a bien une autre
occurrence de cette séquence, mais elle se différencie de la première par
you à la place de they. A première vue, il paraît donc impossible de consi
dérer ces deux séquences comme équivalentes, puisque notre méthode
ne donne aucune technique d'approximation, aucun moyen d'estimer
une différence plus ou moins grande, qui puisse nous permettre de
8. Ceci est même vrai, bien qu'à un moindre degré, dans des textes écrits par ceux
qui respectent les consignes scolaires concernant l'emploi des synonymes pour éviter
les répétitions. Dans ce cas, on trouvera souvent les synonymes dans les mêmes env
ironnements que le mot originel à ne pas répéter. Au contraire, quand un auteur a inten
tionnellement utilisé un mot différent pour exposer une nuance particulière de sens que
ce mot exprime, il y aura souvent une différence correspondante entre les environ
nements du synonyme et du mot originel.
17. 22
dire que ces deux séquences sont assez semblables pour être considérées
comme équivalentes. En fait, puisque nous n'opérons pas sur le sens des
morphèmes, le remplacement de they par you pourrait constituer une
différence importante (comme ce serait le cas si tout le texte traitait de la
distinction entre you et they). Telles quelles, ces deux séquences ne seraient
donc pas rapprochées par notre méthode; tout ce que cette méthode
pourrait faire, serait de trier les parties identiques et les parties diffé
rentes. En fait il se trouve cependant qu'un examen un peu plus appro
fondi montre que ces deux séquences sont contextuellement identiques
— c'est-à-dire identiques quant à leur environnement pertinent ou
contexte. On verra cela au paragraphe 7.1.
Dans l'élaboration des chaînes d'équivalence, il importe de se confor
mer rigoureusement aux exigences formelles de la méthode, ceci constitue
la première garantie; si nous ne faisons jamais d'approximations, si nous
ne négligeons jamais une « petite » différence dans l'environnement, nous
serons assurés que deux membres quelconques d'une même classe d'équi
valence ont au moins un environnement en commun. Si nous voulons
mettre dans une même classe deux éléments alors qu'aucun environne
ment de l'un n'est identique à un environnement de l'autre, il nous faudra
ajouter à la méthode un postulat explicite, qui rendra égaux deux env
ironnements ou neutralisera leur différence.
Il faut enfin examiner, quand on se demande s'il faut inclure ou non
deux éléments dans une même classe d'équivalence, comment fonctionner
ait, l'analyse du texte, la classe qui résulterait de cette inclusion,
dans
c'est-à-dire le genre de tableau à double entrée que l'on obtiendrait en
utilisant cette classe : ce facteur doit jouer un rôle, car il y a souvent
plusieurs chaînes d'équivalence possibles qui satisfont à la méthode. Il
ne s'agit pas de considérer des critères externes, comme la longueur de
la chaîne par exemple; il s'agit plutôt de chercher une distribution syst
ématique des classes, c'est-à-dire d'essayer d'établir en termes de ces
classes un certain fait structurel sur le texte. Autrement dit, nous essayons
de dresser des classes telles qu'elles aient une distribution intéressante
pour notre texte. On pourrait penser que c'est une garantie plutôt cir
culaire pour la construction des chaînes d'équivalence; mais cela signifie
simplement que toutes les fois que nous devons décider s'il faut pousser
plus loin une chaîne d'équivalence, nous étudions comment le nouveau
jalon s'inscrira dans notre texte analysé, tel qu'il se présentera une fois
représenté en fonction de cette nouvelle classe. On utilise aussi ce genre
de considération en linguistique descriptive quand on doit décider, par
exemple, jusqu'où aller dans la subdivision d'une séquence phonologique
en morphèmes 9.
9. Cf. Methods in structural Linguistics, p. 160, de Harris (Chicago, 1951). Il va sans
dire que cet emploi vague de la prévision est une formulation préliminaire. Des analyses
poussées montreront ce que l'on peut attendre des différents types de chaînes d'équi
valence, et permettront ainsi une formulation plus précise des garanties.
18. 23
On pourrait demander de quel droit nous mettons deux mots dans
une même classe d'équivalence pour l'unique raison qu'ils se présentent
tous deux dans le même environnement. Ce à quoi nous répondrons que
la classe d'équivalence indique seulement ce que font distributionnelle-
ment ses membres dans le texte : si, dans ce texte, deux mots ne se pré
sentent que dans des environnements identiques ou équivalents, alors,
dans ce texte, il n'y a pas de différence dans leur distribution (à part leur
ordre dans la colonne, qui est préservé). Nous ne nions pas qu'il puisse y
avoir des différences de sens ou de distribution en dehors de ce texte.
Nous avons jusqu'ici reconnu deux classes d'équivalence. L'une,
que nous appellerons P, contient pour l'instant :
Millions
Four out of five people in a nation wide survey
l'autre, que nous appellerons W, contient pour l'instant :
Can't be wrong
sag they prefer X- to any hair tonic they've used.
6.2. Segmentation.
Dès que nous voyons à peu près quelles classes d'équivalence nou&
voudrions expérimenter dans notre texte, nous le divisons en segments
successifs de manière à avoir, dans chaque segment, des occurrences
semblables des mêmes classes d'équivalences. Si nous avons jusqu'ici les
classes P et W et si nous avons quelques successions de la forme PW,
nous essayons de les diviser en segments contenant chacun exactement un P
et un W. Par exemple, le titre du slogan est représenté par PW. La pre
mière phrase après le titre paraît contenir un P (le mot Millions), mais le
reste de la phrase n'est pas égal à W et ne le contient pas; on laisse
donc la phrase non analysée, et même son P est-il douteux.
L'appartenance d'un élément à une classe particulière dépend tou
jours de l'appartenance de son environnement. Les éléments ne se défi
nissent qu'en fonction de leur environnement. Ainsi donc, il se pourrait
que le Millions de cette phrase ne soit pas le même mot que le Millions
du titre. En linguistique descriptive, deux segments identiques du point
de vue phonologique ne constituent un même morphème que s'ils figurent
dans la même classe de morphèmes : il faudrait probablement considérer
sun (soleil) et son (fils) comme le « même » morphème, au même titre
que table (de bois) et table (de logarithmes); s'ils figurent dans des classes
de morphèmes différentes, comme par exemple sea (mer) et see (voir),
ils ne sont certainement pas le même morphème; et si nous voulons ne pas
faire disparaître le rapport entre (a) table (une table) et (to) table (tabul
er) nous devons distinguer des morphèmes classés et des morphèmes non
classés, et dire que le morphème non classé table figure à la fois dans la
classe N et dans la classe V. De la même façon, si nous rencontrons Mill
ions deux fois, nous essayons de le considérer comme un « même » mor-
19. 24
phème répété (donc de la même classe), et de considérer ainsi ses deux
environnements comme équivalents. Mais il se peut que nous découvrions
ensuite qu'on obtient une meilleure analyse du texte en ne considérant
pas ces deux environnements comme équivalents (parce que le premier
environnement est équivalent à une certaine séquence A dans le texte,
tandis que le second est équivalent à une autre séquence B, qui n'est pas
équivalente à A). Ainsi donc il se peut que nous ayons à considérer les
deux occurrences de millions comme appartenant à deux classes diffé
rentes. Nous verrons à la section 9 que c'est bien le cas ici.
ReVenons-en à notre segmentation. La deuxième phrase du texte
est PW, et la troisième PW. Nous essayons donc de segmenter notre texte
en tranches successives contenant chacune exactement PW et pas plus.
Ces tranches seront alors les rangées successives de notre tableau à double
entrée. Il s'agira souvent d'une phrase entière, mais pas nécessairement :
les différentes sections d'une phrase composée, chacune ayant sa propre
structure de phrase (comme les deux E'T du paragraphe 5.3.), peuvent
aussi constituer des tranches. Mais toute autre portion de la phrase peut
aussi constituer une de ces tranches. Par exemple, si nous avions dans
notre slogan la phrase : Millions of people — four out of five — can't
be wrong when they say they prefer X, qui, telle qu'elle est là, paraît consis
ter PPWW, nous essaierions de la réduire à deux segments PW.
en
Ces segmentations, moins évidentes, demandent la plus grande attention,
car nous voulons non seulement que les occurrences de P et W soient les
mêmes dans chaque segment, mais aussi que le rapport entre P et W
soit le même. Quand, dans une suite de phrases, chaque phrase tout entière
se réduit à PW,le rapport entre P et W dans chaque segment est le même;
la linguistique descriptive nous apprend que c'est le rapport entre sujet
et prédicat. Nous n'avons pas besoin d'utiliser ce renseignement spéci
fique pour analyser notre texte en PW successifs, mais nous tenons pour
acquis que, quel que soit le rapport entre P et W dans un segment, il est
le même dans tous les autres segments. Sans quoi il serait faux de dire,
en face d'un tableau à double entrée, comme les TE successifs du para
graphe 5.4., que les segments successifs sont identiques pour ce qui est
de T et E. Nous verrons aux paragraphes 7.2. et 7.3. les techniques
permettant de vérifier que le rapport entre les classes d'équivalence de
chaque rangée est le même.
6.3. Séries de segments semblables.
On ne réussira généralement pas à diviser tout un texte en segments
contenant les mêmes classes d'équivalence (dans le même rapport les
unes par rapport aux autres). Il peut y avoir ici et là des phrases qui
tout simplement ne contiennent pas ces classes : elles peuvent se révéler
être des phrases d'introduction ou des ramifications d'une autre série
de classes d'équivalence. Et le texte peut être constitué de morceaux suc
cessifs, sortes de sous-textes à l'intérieur du texte principal, comme des
20. 25
paragraphes ou des chapitres contenant chacun ses propres classes d'équi
valence différentes de celles des autres morceaux.
En cherchant les segments qui contiennent les mêmes classes, on
découvrira les limites de cette appartenance à une même classe, c'est-
à-dire les endroits où l'on obtient des fragments du texte contenant des
classes différentes. En règle générale un texte ne se réduira donc pas à
une seule série de rangées identiques (chaque rangée, comme TE, repré
sentant un fragment contenant les mêmes classes d'équivalence), mais à
une succession de séries de rangées identiques à l'intérieur de chaque série
avec, ici et là, des rangées individuelles et différentes.
Ayant obtenu ce résultat, nous comparons alors les différentes séries
et rangées individuelles, pour voir leurs ressemblances et leurs différences
en ce qui concerne l'agencement de leurs classes, que les classes spéci
fiques soient différentes ou non. Nous essayons de découvrir des schemes
dans l'occurrence de ces ressemblances au cours de la succession des séries
et des rangées individuelles. Par exemple, supposons un texte de la
forme AB TE TE TE A'B' EP EP AB KD LM LM K'D' MS MS MS
FBV MS. Si nous utilisons des crochets pour représenter une série de
fragments de la même forme en laissant momentanément BV de côté,
nous pouvons alors représenter le texte par AB [TE] A'B' [EP] AB KD
[LM] K'D' [MS]. Nous remarquons alors que AB [TE] A'B' [EP] et KD
[LM] K'D' [MS] sont structurellement identiques : tous deux sont de
la forme w [xy] w' [yz]; c'est un rapport particulier entre w, x, y et z;
notre texte consiste en deux occurrences de cette structure, plus une
deuxième apparition du w de la première occurrence (c'est-à-dire le AB)
entre les deux structures (ou avant la seconde structure), et plus un FBV
unique avant la fin de la dernière structure.
7. — Techniques auxiliaires.
Il faut affiner et compléter la procédure centrale, que nous venons de
voir, à l'aide de plusieurs techniques auxiliaires.
7.1. Occurrence indépendante.
La distribution des classes d'équivalences (leur scheme d'occur
rence)et la segmentation en fragments qui les contiennent, dépendent de
ce que nous reconnaissons être une occurrence d'un élément. A première
vue, cela peut paraître tout simple : dans la suite Say they prefer X- to
any hair tonic they've used before, nous trouvons évidemment say une fois,
they deux fois, etc., En y regardant de plus près cependant nous voyons
que toutes les occurrences des éléments ne sont pas indépendantes : cer
tains éléments ne se trouvent, dans un environnement donné, qu'en pré
sence d'un autre élément. Cette situation est connue en linguistique des
criptive; par exemple le 5- de he walks n'est pas pris comme élément
indépendant, mais comme une co-occurrence automatique de he, par
21. 26
comparaison avec / walk, you walk 10; et dans des formes comme both
he and I, la présence de both entraîne toujours celle de and, si bien qu'on
peut considérer both ... and comme un seul élément — et non comme
deux éléments. De la même façon, si dans un texte nous trouvons des
éléments identiques (répétés) ou différents, dont l'un n'apparaît que si
l'autre est présent, nous concluons que ces occurrences ne sont pas indé
pendantes l'une de l'autre et nous indiquons leur occurrence combinée
comme un seul élément dans notre représentation du texte.
Pour they prefer X- to any hair tonic they've used nous ne pouvons le
comparer qu'à you too and your whole family will prefer X- to any hair
tonic you've used. Dans les deux cas, ce qui vient avant prefer contient le
mot qui précède 've; nous pouvons donc dire que le mot qui précède 've
n'est pas indépendant ou, plutôt, que le choix de l'un des deux membres
du groupe they /you dépend de celui des deux mots de ce groupe qui se
trouve devant prefer. Si le signe Q représente la répétition du membre
du groupe they /you qui se trouve dans ce qui précède prefer, on a :
U X J I J X XX
they prefer X- to any hair tonic Q've used
You... will prefer X- to any hair tonic Q've used.
Maintenant que nous avons réduit ces énoncés à leurs éléments
indépendants, nous constatons que leurs dernières parties sont devenues
identiques; par conséquent les premières parties des deux phrases se
trouvent dans des environnements identiques, elles sont donc équival
entes; puisque la première appartenait à la classe P, la seconde you too...
appartient aussi à P u.
Ceci était un type d'occurrence liée; il y en a bien d'autres sortes
qu'il faut étudier; et les enseignements tirés de cette étude sont utiles
à la fois pour l'analyse du discours et pour une linguistique descriptive
plus détaillée.
Les pronoms en offrent un exemple important. Si le slogan avait dit
you... will prefer it, au lieu de you... will prefer X-, nous commencerions
par considérer it comme un nouvel élément, à placer dans une nouvelle
classe d'équivalence. Mais, en fait, l'occurrence de it dépend de l'occur
rencede X- : si le X précédent avait contenu le morphème de pluriel
(X-s), le pronom dans cette phrase aurait été them. D'autres mots du
groupe de it, comme he ou you, ne peuvent figurer tant que X- apparaît
dans la phrase précédente. Il en est de même pour des mots comme
10. Le s fait aussi partie de tous les noms singuliers (The child walk-s, etc.). Ou on
peut également considérer que walks, goes, etc., sont des variantes de walk, go, etc.
après he et les noms singuliers.
11. Avant d'en venir là, il faut effectuer un certain nombre d'autres opérations pour
réduire Four out of fives... say they prefer... à deux séquences PW : Four... say... et they
prefer..., la phrase You... will prefer... étant une troisième séquence PW. Sinon, les mots
say they resteraient, puisque la séquence P (équivalente à millions) est seulement Four
out of five people in a nation wide survey, et puisque la séquence W corrigée (identique
au W de You... will prefer) est seulement prefer X- to any hair tonic Q've used (cf. para
graphe 9).
22. 27
this /these, who /which, qui dépendent eux aussi de mots particuliers appa
raissant à un autre endroit du texte. Sans faire appel à aucune connais
sance sur la signification de ces pronoms ou sur leur « référence » aux
noms qui les précèdent, nous pouvons conclure, d'après leur distribution
dans le texte, que ce ne sont pas des éléments indépendants : ils contiennent
une partie (discontinue) de l'occurrence du morphème auquel ils sont
correliés.
On rencontre un autre type d'occurrence liée dans des expressions
réciproques comme each other et together qui introduisent dans la langue
certaines des fonctions remplies par les variables dans les expressions
mathématiques — mais avec ce manque de netteté et cette complexité
qui sont caractéristiques de la langue. La phrase Foster and Lorch saw
each other at the same moment est normale; mais enlevez and Lorch, et
tous les anglophones remplaceront immédiatement each other par autre
chose. Autrement dit, nous ne trouvons pas de phrase qui contienne each
other sans contenir soit l'expression and Z, soit un morphème de pluriel
dans le nom correspondant. Et aussi bien nous trouverons la phrase
Electrons and positrons attract each other, mais nous ne trouverons pas
— dans un livre de physique tout au moins — la même phrase avec
omission de and positrons, sauf s'il y a aussi d'autres modifications telles
que le remplacement de attract par repel.
On peut remarquer que les éléments dépendants ont particulièrement
tendance à appartenir, dans leurs différentes occurrences, à des classes
d'équivalence différentes, puisque chaque occurrence appartient à la classe
de l'élément, quel qu'il soit, qui lui est correlié. Si le texte disait : You
will prefer X-, You will prefer it, The survey showed, It showed, la première
occurrence de it appartiendrait à la classe de X-, la seconde à la classe
de survey.
Dans tous ces cas, on peut éliminer les rapports spéciaux d'occur
rence liée entre des éléments particuliers, en faisant simplement de l'él
ément dépendant une partie de l'élément auquel il est correlié (dont son
occurrence dépend). Il est bien entendu que, quand nous parlons de
dépendance, l'application que nous en faisons est restreinte au texte
particulier considéré. Il se peut que l'interdépendance entre les pronoms,
ou les mots réciproques, et un quelconque nom voisin se maintienne dans
tous les textes où ces mots apparaissent; mais l'interdépendance entre
les deux occurrences de they ou de you dans notre texte est spécifique
à ce texte; on pourrait trouver ailleurs la phrase they prefer X- to any
hair tonic you've used; mais dans ce texte particulier, nous n'avons pas
cette phrase. C'est pourquoi dans ce texte nous pouvons dire ce que le
second pronom doit être, en considérant le premier.
7.2. Subdivisions des phrases.
La présence d'éléments dépendants nous conduit à considérer diff
éremment la subdivision des phrases.
23. 28
Quand les parties dépendantes d'un élément sont dispersées sur
toute une zone, nous devons généralement considérer toute cette zone
comme constituant un seul fragment comportant cet élément. Dans
they prefer X- to any hair tonic they've used par exemple, nous avons mont
ré que les deux occurrences de they sont interdépendantes dans ce texte;
nous pouvons donc décomposer cet énoncé en they (se présentant dans les
deux positions) plus... prefer X- to any hair tonic... 've used; de même
pour la phrase avec you (également dans les deux positions). Il s'agit là
d'un traitement plus général que celui du paragraphe 7.1., qui donnait
un statut privilégié à la première occurrence de they et de you en en fai
sant dépendre la seconde occurrence, et qui fondait l'identité des deux
phrases dans leur dernière partie sur le fait que toutes deux renfermaient
le même type de dépendance (Q). Ce nouveau traitement élimine la
dépendance en considérant que l'unique they ou you figure dans les deux
positions, et établit sans conditions l'identité des secondes parties des
phrases. Le résultat de ce nouveau traitement est que, puisque le they
à double position s'étend sur presque toute la longueur de la seconde
partie, toute cette seconde partie doit être enfermée dans le même frag
ment que they. L'unification des deux occurrences de they nous empêche
donc de faire là deux segments; sinon nous aurions pu avoir deux seg
ments : they prefer... et soit they've used soit Q've used.
D'un autre côté, il y a des cas où la dépendance nous conduit à dis
tinguer plus de segments que nous ne le ferions autrement. Prenons par
exemple la phrase Casals, who is self-exiled from Spain, stopped performing
after the fascist victory. Si nous étudions le texte dans lequel est enchâssé
cet énoncé, nous trouvons que le who est dépendant de Casais, tout comme
le second they est dépendant du premier : le texte contient And the same
Casals who... mais plus loin The records which... Nous pouvons donc dire
que le who « contient » Casals, c'est-à-dire qu'il en est soit la continuation,
soit la répétition. Mais laquelle des deux est-il? S'il en est la continuation,
nous n'avons qu'un segment, la première partie (C) étant Casals who,
la seconde (S) étant is self exiled... stopped... S'il en est la répétition, nous
avons deux segments, l'un enchâssé dans l'autre : le premier est constitué
de Casais (C de nouveau), plus stopped performing (Sx), le second de who
(considéré comme équivalent de Casals) plus is self-exiled (S2). Nous
n'opterions pour la seconde solution que si nous pouvions montrer, en
fonction du texte, que is self-exited... et stopped performing... sont deux
éléments distincts (et non simplement deux parties d'un même long él
ément) — si, par exemple, nous trouvions dans le texte deux autres
phrases : The press failed to say why he stopped performing, etc. But he
has stated publicly why he is self-exiled, etc. Dans tous les cas, who contient
Casals. Mais si la phrase originelle est Casals who S, notre analyse donne
CS, tandis que si (à la lumière des deux dernières phrases) nous considé
ronsphrase originelle comme étant Casals who S2SV notre analyse donne
la
CC S2 Sv et divise la phrase en deux segments CS2 et CSj, le résultat
24. 29
étant que S2 et Sx sont équivalents puisqu'ils apparaissent tous deux
après C. La seule différence qu'il y a entre le fait déconsidérer un élément
dépendant comme une continuation et le fait de le considérer comme
une répétition réside dans le nombre de segments — un ou deux — en
lequel nous pouvons alors décomposer le tout.
Nous venons de voir que, quand une phrase contient un élément A,
qui est dépendant de B, nous pouvons soit considérer toute la phrase
comme un seul segment dans lequel A est simplement une continuation
de B, soit la considérer comme deux segments, l'un contenant B et l'autre
contenant A dans la même classe que B. En règle générale, on optera
plutôt pour cette seconde solution si le reste de la phrase peut se diviser
en deux parties comparables, l'une allant avec A et l'autre avec B.
Des choix de ce type peuvent se présenter même là où il n'y a pas
de formes dépendantes. Par exemple, dans notre second texte, nous
avons ensuite la phrase The self-exiled Casals is waiting across the Pyrenees
for the fall of Franco; nous souhaitons mettre self-exiled dans la même
classe que is self-exiled..., puisqu'ils comportent les mêmes morphèmes
(à condition de pouvoir montrer d'après le texte lui-même que self-exiled
est équivalent à self-exiled from Spain); ceci nous donne la structure de
phrase particulière S2 C S3, par comparaison avec les phrases CS précé
dentes. Si maintenant par un heureux hasard le texte contenait également
la phrase Casals is waiting across the Pyrenees for the fall of Franco (ce
qui est trop demander en fait de répétition), nous serions à même de faire
l'analyse suivante : nous avons comme phrases du texte : CS1} C is S2,
S2CS3, CS3; les séquences S1} S2 et S3 sont toutes membres d'une même
classe d'équivalence S, puisqu'elles apparaissent toutes après C. La diff
iculté vient de cet étrange objet qu'est S2CS3. Disons maintenant que
toute phrase XjAX2 peut être « transformée » en A is Xj : AX2 12; ceci
signifie que, si XjAXg se trouve dans le texte, alors A is Xx : AX3 s'y
trouve aussi; dans ce cas, nous considérons XXAX2 comme équivalent à
A is Xx : AX2. Notre étrange objet S2CS3 disparaît alors : nous le rempla
çons C is S2 et CS3, qui tous deux se retrouvent ailleurs dans le même texte.
par
On peut continuer dans cette voie jusqu'à des transformations qui ne
sont pas déjà justifiées par le texte, pourvu qu'elles ne soient pas en contra
diction avec lui. Par exemple, nous trouvons dans le texte les phrases
The memorable concerts were recorded in Pardes... The concerts were recor
dedfirst on tape. Nous pouvons écrire ceci MNRX : NR2 (l'équivalence de
Rx et R2 est supposée démontrée à un autre endroit du texte), et nous
transformerions la première phrase en N is M : NRr Nous ne prétendons
pas par là que notre transformation N is M (The concerts were memorable)
figure vraiment dans le texte, ou qu'il n'y ait pas de différence stylistique
ou autre entre The memorable concerts were recorded in Prades et The
12. Dans les formules comme A is Xt : AX2, le : indique la fin d'une phrase ou
d'un segment. (On l'utilise de préférence au point qui risquerait d'être confondu avec
le point marquant les fins de phrase dans le texte de l'auteur.)
25. 30
concerts were memorable : The concerts (ou They) were recorded in Prades.
Tout ce que cette transformation signifie, c'est qu'on considère MNRj^
comme équivalent de N is M : NRj, parce qu'on trouve bien S2GS3
comme équivalent de C is S2 : CS3, en ce sens que tous deux figurent
dans le texte modifié.
D'une part nous avons éliminé de notre agencement en tableau la
structure de segment spéciale MNRX ou S2CS3 — spéciale parce que
les autres segments sont tous de la forme NR ou CS. D'autre part, nous
avons découvert que M (ou plutôt is M) est membre de la classe R. Mais
surtout nous avons établi qu'une phrase peut être représentée par deux
segments même si elle ne contient pas deux ensembles des classes d'équi
valence voulues. C'est ce qui arrive quand nous pouvons démontrer
qu'une seule classe dans la phrase a ailleurs un rapport indépendant avec
deux autres classes ou éléments. Cette classe est donc répétée une fois
dans chaque segment; et chaque segment marque individuellement le
rapport de cette classe avec l'une des deux autres 13.
Ces difficultés dans la division en segments viennent des rapports
que les classes d'équivalence entretiennent les unes avec les autres. Une
phrase n'est pas simplement l'occurrence simultanée de différents mor
phèmes ou séquences; ceux-ci sont généralement liés, les uns aux autres,
par un rapport spécifique, qui peut s'exprimer par un ou plusieurs mor
phèmes d'ordre : You wrote Paul et Paul wrote you ne diffèrent que par
l'ordre des morphèmes. Si nous trouvons dans notre texte plusieurs seg
ments de la forme CS, cela signifie que C est dans un rapport particulier
avec S — celui de se présenter avec S, et devant lui. Puisque nous n'opé
ronspas sur le sens, nous ne savons pas ce que c'est que ce rapport, mais
nous prenons soin de représenter le même ordre de morphèmes dans la
phrase par le même ordre de classes dans le segment. Quand maintenant
nous trouvons S2CS3, nous ne savons pas quel est le rapport entre cet
ordre et l'ordre CS, et nous ne pouvons faire aucune comparaison entre
les deux phrases. Il faut donc réorganiser ce S2CS3 inconnu, pour qu'il
contienne les mêmes classes dans le même ordre que d'autres segments
— et, bien entendu, nous devons montrer que la forme remaniée est équi
valente, pour ce texte, à la forme originale. Dans la plupart des cas, la
seule façon d'y arriver est de diviser la phrase inconnue, au moyen de
transformations comme celles que nous avons vues plus haut, en deux ou
plusieurs segments, de façon à ce que les segments obtenus aient une forme
qui se rencontre dans le texte.
De cette manière, nous obtenons un grand nombre de segments de
structure semblable, même dans un texte dont les phrases sont très
différentes les unes des autres.
13. Nous avons considéré ici le cas important de la séquence adjectif + nom
+ verbe, dans laquelle le nom a des rapports indépendants avec l'adjectif et avec le
verbe. On peut représenter l'adjectif, aussi bien que le verbe, comme prédicat du nom.
Nous reviendrons sur cette question au paragraphe 7.3.
26. 31
7.3. Transformations grammaticales.
Nous avons vu jusqu'ici comment on peut étudier la structure d'un
texte sans faire appel à aucune information qui ne soit pas fournie par le
texte lui-même : la procédure directe consiste à dresser des classes d'équi
valence et à découvrir des schemes de combinaison de ces classes dans
les segments successifs du texte (c'est-à-dire à trouver des combinaisons
semblables ou partiellement semblables). On obtient souvent cependant
beaucoup de petites classes et de segments qui ne sont pas semblables,
parce que les phrases sont si différentes les unes des autres; quand c'est
le cas, on s'aperçoit qu'en comparant les phrases du texte on peut parfois
montrer qu'une partie d'une phrase est équivalente (pour ce texte) à
une partie différente d'une autre phrase et, par conséquent, qu'elle contient
les mêmes classes. Ceci dépend du nombre de répétitions que contient le
texte.
Passons maintenant à la possibilité de pousser plus loin dans la
même direction en faisant appel à une information extérieure au texte;
celle-ci sera de la même nature que celle que nous avons cherché à établir
à l'intérieur du texte, c'est-à-dire qu'elle conservera l'équivalence de
parties de phrases (au sens où MNR est équivalent à N is M : NR); elle
reviendra à la même opération fondamentale, c'est-à-dire à la comparaison
de phrases différentes. Et elle tendra au même but : montrer que deux
phrases, différentes par ailleurs, contiennent la même combinaison de
classes d'équivalence, même si elles contiennent des combinaisons diff
érentes de morphèmes. La seule nouveauté, c'est qu'au lieu de comparer
deux phrases du texte, nous comparerons une phrase du texte à des
phrases qui ne sont pas dans le texte.
On pourrait penser qu'il s'agit là d'une différence capitale et s'inter
rogersur la validité de l'application à notre texte d'une équivalence ainsi
établie. Nous avons déjà répondu à cette objection au paragraphe 3 : si
nous pouvons montrer que deux séquences sont équivalentes dans toutes
les phrases anglaises où elles figurent, alors elles sont équivalentes dans
tout texte écrit en anglais. Si dans toute phrase anglaise contenant XAY,
le XAY est équivalent à A is X : AY, alors si nous trouvons S2CS3 dans
notre texte anglais nous pouvons dire que S2CS3 équivalent à C is S2 : CS3.
Mais qu'est-ce que Y équivalence? Deux éléments sont équivalents
s'ils se trouvent dans le même environnement à l'intérieur de la phrase.
Deux phrases d'un texte sont équivalentes simplement si elles se trouvent
toutes deux dans ce texte (sauf si on découvre des détails de structure
assez fins pour montrer que deux phrases ne sont équivalentes que si elles
figurent dans des positions structurelles semblables dans ce texte). De
même, deux phrases d'une langue sont équivalentes si elles se rencontrent
toutes deux dans cette langue. En particulier, on dira que des phrases de
la forme A sont équivalentes à des phrases de la forme B si, pour chaque
phrase A, on peut trouver une phrase B contenant les mêmes morphèmes,
27. 32
mises à part les différences dues à la différence de forme entre A et B :
par exemple, I^VNa est équivalent à N2 is V-en by Nx parce que pour
toute phrase comme Casals pldys the cello, on peut trouver une phrase
The cello is played by Casals.
Nous ne soutenons nullement que deux phrases équivalentes signi
fient nécessairement la même chose, ni qu'elles soient pareilles du point
de vue stylistique. Mais par contre nous soutenons que toutes les phrases
ne sont pas ainsi équivalentes : la relation d'équivalence n'est pas sans
intérêt, comme elle le serait si elle existait pour toutes les phrases. Par
exemple, NjVN,} n'est pas équivalent à Nx is V-en by N2, parce que cette
dernière forme se trouve pour certains N± et certains N2 (I saw you et
/ was seen by you), mais pas pour tout Nj^ et tout N2 (on ne trouve pas
Casals is played by the cello) u. Nous affirmons de plus que l'application
de cette équivalence grammaticale provenant de l'extérieur nous per
mettra de découvrir dans notre texte des segments semblables supplément
aires nous ne pourrions pas trouver par la simple comparaison des
que
phrases du texte. Ainsi, on peut démontrer que dans divers environne
ments he, etc., sont grammaticalement équivalents aux noms qui les
who,
précèdent, et que Nx who Vx V2 est équivalent à NjVg : N^; dans Casais,
who is self-exiled... stopped performing..., il y a deux segments CSX : G
is S2; nous aboutirions à ce résultat (sans avoir à nous préoccuper de
savoir si Casals who constitue une occurrence prolongée de C, ou deux
occurrences répétées), même s'il n'y avait pas d'autre occurrence de who
dans le texte, c'est-à-dire même si l'analyse était impossible à partir du
seul texte. L'équivalence grammaticale nous est particulièrement utile si
nous avons par exemple un grand nombre de segments contenant tous
Casais, entremêlés avec beaucoup d'autres contenant he, et si nous ne
pouvons trouver aucun environnement contextuel commun pour démont
rer que Casais et he sont équivalents. Dès que nous acceptons cette
équivalence grammaticale, nous pouvons montrer que tous les environne
ments Casais sont équivalents à ceux de he; et ceci peut à son tour
de
nous permettre de découvrir d'autres équivalences à partir du texte.
On peut explorer plus systématiquement l'équivalence grammaticale
en introduisant une technique de variation expérimentale. Supposons
que nous ayons une phrase d'une forme donnée A et que nous voulions
une forme B; nous essayons de modifier A, le changement consistant un
iquement en la différence formelle qui existe entre A et B, pour voir
ce qui se passe alors en A. Supposons par exemple que nous ayons The
memorable concerts were recorded... qui est de la forme MNR, et que nous
voulions rendre la forme de cette phrase comparable à celle de segments
précédents commençant par N; à cette fin, nous cherchons une variante
14. Il est vrai qu'on pourrait soutenir que cette dernière phrase est encore gramm
aticale. Mais la grammaire actuelle ne fait pas de distinctions entre les divers membres
d'une classe morphologique. Par conséquent, l'exigence que la phrase B contienne les
mêmes morphèmes que la phrase A sort de la grammaire, au sens courant de ce terme.
28. 33
de cette phrase qui commence par The concerts; on peut essayer de
l'obtenir en plaçant un informateur dans une situation sociale authen
tique productrice de parole (et non un exposé linguistique sur la parole),
dans laquelle il énoncerait une phrase commençant par The concerts et
contenant les mots memorable et recorded 15. Ou bien on peut y arriver
par le travail fastidieux de l'observation, en cherchant une phrase qui
commence par The concerts et contienne memorable et recorded. Par l'une
ou l'autre de ces deux méthodes, nous pourrions obtenir The concerts
were memorable and were recorded, ou quelque chose d'approchant 16,
qui montrerait que quand M (ou tout autre adjectif) passe de l'autre côté
de N (le nom qui le suit), on insère is; MN est équivalent à N is M. Nous
découvrons ainsi que, quand MNR passe à une forme qui commence
par N, un is apparaît entre N et le M qui le suit.
Cette technique consistant à faire varier la forme grammaticale
d'une phrase, tout en gardant constants ses morphèmes ne peut pas s'ap
pliquer à l'intérieur d'un texte; car là, tout ce que nous pouvons faire,
c'est étudier le matériau qui nous est donné. Mais on peut l'utiliser pour
la langue, hors du texte, car nous avons le droit, en tant que locuteurs,
de créer une situation sociale qui pourrait amener un autre locuteur à
prononcer telle phrase plutôt que telle autre parmi toutes les phrases dont
il dispose. Cette technique est particulièrement utile avec une langue
comme l'anglais, où tant de morphèmes figurent dans diverses classes
grammaticales.
Le paragraphe précédent montre la précaution essentielle que nous
devons prendre quand nous appliquons l'équivalence grammaticale pour
étoffer les classes d'équivalence contextuelle : nous ne nous posons pas
simplement la question : Quelles formes de phrase sont équivalentes à
MNR? Il peut y en avoir beaucoup. La question que nous nous posons est :
Puisque N... est une forme commune dans ce texte, et puisque nous y
trouvons aussi MNR, peut-on remplacer cette dernière forme par une
phrase équivalente de la forme N...? Le sens du changement à opérer
n'est pas arbitraire mais vient entièrement du texte. Comme précédem
ment, revient à diviser les phrases en des segments aussi semblables
cela
que possible. Tout ce que nous nous demandons, c'est s'il existe une équi
valence grammaticale qui relie MNR à la forme N...; la réponse est oui,
pourvu qu'un is figure dans la forme N...; ce qui à son tour fait de is M
15. Pour donner un exemple très simple, on peut lire en compagnie de l'informateur la
phrase du texte The memorable concerts were recorded, puis s'arrêter et lui dire de façon
hésitante et interrogative « That is to say, the concerts » (c'est-à-dire, les concerts...)
et attendre qu'il donne la suite.
16. Nous pouvons trouver beaucoup de phrases qui commencent par The concerts
et qui contiennent les deux autres mots, par exemple The concerts were not memorable,
but were neverthless recorded. Ces phrases contiendront divers mots en plus de ceux de la
phrase originelle; mais le seul mot nouveau qui se trouvera dans toutes les phrases de la
forme voulue NMR (ou plutôt dans une sous-classe des phrases NMR) sera une forme
du verbe to be. C'est donc le seul mot nouveau qui soit indispensable quand on opère
le changement pour obtenir cette forme.
29. 34
un équivalent de R. Comme ailleurs en linguistique, il ne s'agit pas de
donner à toutes les phrases n'importe quelle forme choisie arbitrair
ement; méthode permet simplement de décrire les formes moins
la
fréquentes du texte (MNR) en fonction des formes fréquentes (N...).
Pour l'analyse purement contextuelle, nous n'avons besoin de connaître
que les limites des morphèmes. Pour utiliser les équivalences grammatic
ales, devons également connaître la classe morphophonologique à
nous
laquelle chaque morphème de notre texte appartient, puisque les règles
grammaticales concernent des classes plutôt que des morphèmes indivi
duels. Dans le cas considéré, la règle grammaticale est : adjectif + noin
est équivalent à nom + is + adjectif; pour pouvoir l'appliquer à notre
séquence MN, nous devons savoir que le M est un adjectif et que le N
est un nom.
On a constaté empiriquement que le nombre d'équivalences grammat
icales auxquelles on fait appel à chaque fois pour réduire des phrases
d'un texte en des segments semblables, est relativement peu élevé. C'est
pourquoi, même si on n'est pas linguiste, on peut apprendre beaucoup
sur le texte en utilisant (en plus de la méthode d'analyse interne du texte)
une liste préétablie des principales équivalences grammaticales pour la
langue en question. Voici quelques-unes des équivalences qui sont fréquem
ment utilisées (nous ne donnons aucune preuve de leur validité, et seul
ement quelques indications très approximatives des environnements de
phrase où elles s'appliquent) 17.
1) Si nous trouvons XCY, alors X = Y (X est équivalent à Y). Le
C est une conjonction comme and, but, or, ou bien, dans certaines circons
tances spéciales, un syntagme comme as well as, rather than, A-er than.
X et Y doivent être dans la même classe grammaticale. Par exemple, dans
I phoned him but he was out, X et Y sont tous deux de la forme NV; dans
I saw it but went on, Y est seulement constitué par le syntagme verbal
went on, X ne peut donc inclure que le syntagme verbal saw it (et non
toute la séquence I saw if). Il s'ensuit que N^CN^ est équivalent à
deux segments N^ : N2V2 et NV^V-j = NVX : NV2.
2) La séquence Nx is N2 indique que Nj_ = N2. La classe de is comprend
remains et d'autres verbes.
3) Nj N2, avec un accent primaire sur chaque N, indique que Nx = N2;
exemple : The pressure P increases est équivalent à The pressure increases
et P increases.
4) NV (that) NV = NV : NV; exemple / telegraphed that we'll arrive
to-morrow est équivalent à I telegraphed : we'll arrive to-morrow.
17. A = adjectif. N = nom, V = verbe, P = préposition. Les indices indiquent des
morphèmes particuliers, sans tenir compte de leurs classes.
30. 35
5) NjVK^ = NgV*^, V et V* étant respectivement actif et passif ou
vice versa.
6) NjPNa = NaP*^; exemple : (they seek) the goal of certainty
est équivalent à une certaine forme comme (they seek) certainty as a goat.
Quand on inverse deux noms la modification des prépositions est bien plus
grande que la modification correspondante des verbes : dans le cas des
verbes, elle s'effectue simplement par l'addition ou le retrait du morphème
de passif et du mot by; dans le cas des prépositions, il faut remplacer une
forme par une forme entièrement différente. Les paires de prépositions
équivalentes ne sont pas fixes : entre certains noms, le substitut de of
peut être as; entre d'autres noms, il peut être with. Néanmoins il est pos
sible de trouver des structures dans lesquelles les noms de la séquence
N2 P N2 sont inversés.
7) Nj P N2 = Ag N1$ autrement dit, le morphème du second nom appar
aîtsous une forme adjectivale avant le premier nom; exemple : training
in médecine et medical training.
8) Des pronoms comme he, et certains mots commençant par wh-
et th-, répètent un nom déjà énoncé. Quand ils sont précédés de plusieurs
noms, quel nom répètent-ils? Cela dépend des détails de l'environnement
grammatical; c'est généralement le nom qui les précède immédiatement,
ou le dernier nom figurant dans un environnement grammatical comparable.
Par exemple, who = the man dans The man who phoned left no name
(N who Vx V2 = NV2 : NVj); who = my roommate dans The man spoke to
my roommate, who told him to call again (N^Ng who V2 = N^Ng :
N2 V2). Il y a de nombreux procédés pour déterminer quel est le nom qu'un
pronom répète, et quel verbe va avec chaque nom. Dans the man who
phoned, on ne peut pas insérer un sujet avant phoned, il faut donc prendre
who comme sujet. Dans The man I phoned was out, nous réduisons d'abord
en / phoned : The man was out; ensuite, puisqu'on ne peut pas insérer un
complément d'objet après phoned dans la phrase originelle, nous faisons
de the man le complément d'objet 18 de phoned et nous obtenons l'équiva
lentphoned the man : The man was out (
: /
9) NV15 V2-ing = NVj_ : NV2; exemple : They escaped, saving nothing
est équivalent à They escaped : They saved nothing.
10) NiClNLj VX = IS^VM, : NgVNj. Ici X représente une classe
d'expressions réciproques comme each other; par exemple : The Giants
and the Dodgers each beat the other twice est équivalent à The Giants beat
the Dodgers twice : The D. beat the G. twice. L'équivalence est quelque peu
différente pour les différents groupes de formes X.
18. La seule façon d'exprimer l'exclusion d'un complément d'objet uniquement en
fonction de l'occurrence des éléments est de dire que l'objet figure déjà. Ce ne peut être
I puisque / est le sujet de phoned, ce doit donc être l'autre N, the man.
31. 36
11) ANV = N is A : NV, cf. l'exemple the self-exiled Casals... du para
graphe 7.2. De même NVANj = NVNj who is A = NVNX : Nt is A;
exemple : They read the interdicted books = They read the books which were
interdicted — They read the books : The bocks were interdicted.
12) NjVKjPNg = NjVNa : N^VPNg; c'est-à-dire qu'on peut remplac
er double complément d'objet par deux compléments d'objet dis
un
tincts dans deux segments qui répètent le sujet et le verbe; exemple :
/ bought it for you = I bought it : I bought for you.
Ces équivalences grammaticales conservent les morphèmes et leurs
rapports grammaticaux, mais sous une autre forme grammaticale. On
ne peut avoir NjVNa = NgVNj, parce que cela modifierait le rapport
sujet-objet avec le verbe; mais on peut avoir N2V*NX comme équivalent
de NjVNa parce que là le verbe aussi est modifié de façon à ce que soit
préservé son rapport grammatical avec les noms inversés. II est absolu
mentessentiel de préserver les rapports grammaticaux, car ces rapports
existent toujours entre les morphèmes d'une phrase. Autrement dit, il y a
des restrictions de commutabilité d'ordre et d'intonation entre les diffé
rents morphèmes (ou classes de morphèmes) d'une phrase et, quand nous
passons d'une phrase à une phrase équivalente, nous voulons pouvoir
retrouver les mêmes restrictions quand nous reviendrons à la phrase de
base — puisque cette phrase de base, comme toute phrase, se définit par les
restrictions qui lient ses différentes parties. Par conséquent, quand nous
divisons une phrase en différents segments pour dresser un tableau, nous
ne voulons pas que deux combinaisons des mêmes classes d'équivalence
(par exemple les deux premières combinaisons TE ci-dessus) représentent
des rapports grammaticaux différents. C'est pourquoi, quand nous trans
formons une phrase qui contient certaines classes d'équivalence, nous
prenons soin de conserver leurs rapports grammaticaux originels.
Cependant, nous trouvons quelquefois des morceaux de phrase qui
ne contiennent aucune de nos classes d'équivalence; autrement dit (dans
le cas le plus simple), ils ne contiennent aucun matériau qui se retrouve
ailleurs dans le texte. Le rapport grammatical entre les morceaux uniques
et le reste de la phrase doit être conservé dans notre disposition en tableau,
au même titre que celui des morceaux récurrents. Mais nous n'avons pas
à nous préoccuper de conserver leur rapport quand leur position relative
change, puisque nous n'avons pas de raison de changer leur position
relative : c'est seulement les classes d'équivalences que nous voulons
redisposer. Pour ce matériau non récurrent, nous voulons seulement
connaître son rapport aux classes d'équivalence et indiquer ce rap
port dans l'analyse. L'étude du texte seul ne suffira peut-être pas, mais
nous pouvons y arriver en faisant appel aux données grammaticales ou
à la variation expérimentale. Revenons par exemple aux séquences Casais,
who is self-exiled from Spain et the self -exiled Casals... Si cette dernière
orme est S2 C, la première est C, C is S2 from Spain; puisque from Spain
32. 37
est unique, tout ce que nous voulons savoir, c'est où le mettre quand nous
disposons nos classes d'équivalence, autrement dit, quel est son rapport
à ces classes. La grammaire nous apprend que dans des phrases de la forme
NV APN l'unité minimale, dont PN est un constituant immédiat, est APN
et que ce APN peut être remplacé par A tout seul 19. Par conséquent, si le
A se trouve être membre d'une de nos classes d'équivalence alors que le
PN ne l'est pas, nous associons le PN à A dans sa colonne d'équivalence
en écrivant APN au lieu de A tout seul comme membre de la classe.
De façon plus générale, le matériau qui n'appartient à aucune classe
d'équivalence, mais qui est lié grammaticalement à un membre d'une classe,
est joint à ce membre pour former un membre élargi de la classe en ques
tion; ainsi self-exiled from Spain est maintenant dans la même classe que
seïf-exiled. Ceci se justifie par le fait que, puisque ce matériau ne se retrouve
nulle part ailleurs dans le texte (ou ne s'y retrouve que dans le même rap
port grammatical à la même classe d'équivalence), son seul effet, quand on
représente le texte par ses classes d'équivalence spécifiques, est précis
ément son rapport au membre spécifique auquel il est grammaticalement lié.
On rencontre un cas particulier assez intéressant quand deux membres
de la même classe d'équivalence constituent conjointement l'unité immé
diatement supérieure de leur phrase (c'est-à-dire quand ils sont les consti
tuants immédiats de cette unité), quand, par exemple, ces deux membres
sont un adjectif suivi d'un nom, avec AN = N. Dans ce cas, nous pouvons
considérer que ces membres constituent à eux deux un seul membre de
leur classe commune et entrent tous deux dans un seul segment. Si nous
les considérions comme deux occurrences de leur classe commune, il nous
faudrait mettre chaque occurrence dans un segment distinct.
Les données grammaticales sont particulièrement utiles quand il
s'agit de reconnaître les particules conjonctives. Il est facile d'identifier
ces morphèmes à partir de la grammaire formelle, tout à fait indépendam
ment sens, mais il peut être difficile de les identifier dans l'ana
de leur
lysepurement contextuelle. Leur importance réside dans le fait que beau
coup de phrases d'un texte peuvent contenir les mêmes classes, à part
quelques mots non classés, souvent situés au début, dont la fonction gram
maticale est de lier ou d'introduire les phrases, et qui n'entrent pas dans
les classes spécifiques qui couvrent la phrase ou le segment. Dans notre
disposition en tableau, nous mettrons ces éléments, en raison de leur posi
tion grammaticale, dans une colonne spéciale au début. Nous pouvons
même aller plus loin et mettre dans cette première colonne tout matériau
qu'on ne peut faire entrer dans aucune des colonnes d'équivalence. Ce
matériau conjonctif n'est pas toujours immédiatement évident; remar
quons qu'on peut analyser beaucoup de phrases de la forme JVV that
N1V1 comme constituées des classes d'équivalence N^, le NV that étant
relégué dans la première colonne; par exemple dans la phrase We are proud
19. Sémantiquement, on dira que PN « modifie » le A.
33. 38
that these concerts were recorded by our engineers, les membres connus des
classes d'équivalence sont concerts et recorded; les mots qui les précèdent
ne se retrouvent pas dans le texte et ne sont liés grammaticalement à aucun
membre d'une classe; bien au contraire, du point de vue grammatical
on peut les remplacer par des adverbes introductifs comme indeed, même si
au sens purement grammatical ils sont en fait le sujet et le verbe princ
ipaux de la phrase.
En plus des rapports grammaticaux des classes grammaticales tout
entières, on peut utiliser des informations concernant le rapport entre
des morphèmes spécifiques ou des sous-classes grammaticales et les classes
grammaticales; on peut par exemple établir que (dans certaines langues)
les verbes intransitifs forment une sous-classe qui ne se trouve jamais
accompagnée d'un objet et qui est équivalente à un verbe transitif accom
pagné d'un objet. Dans un texte donné, cela peut nous permettre de mettre
un verbe transitif et son objet dans la même classe qu'un verbe intransitif
ayant une position comparable.
Enfin un grand nombre d'équivalences détaillées s'appliquent à des
morphèmes spécifiques. Les renseignements concernant ces équivalences
ne nous sont pas fournis par la linguistique descriptive, qui traite géné
ralement de classes entières, mais on peut les obtenir par des méthodes
linguistiques puisqu'ils concernent des occurrences couplées et des restric
tions spéciales — bien que dans la plupart des cas il soit nécessaire d'étu
dier ces restrictions en considérant plus d'une phrase à la fois. Supposons,
par exemple, que nous trouvions les mots buy et sell dans un texte. Leurs
environnsments dans ce texte peuvent ne pas se ressembler assez pour nous
permettre de les ranger dans la même classe d'équivalence, en dépit des
avantages que cela pourrait avoir pour l'analyse. Mais si nous examinons
un certain nombre d'autres textes assez courts où ces deux mots figurent,
nous constaterons qu'ils apparaissent souvent dans des environnements qui
se correspondent et que, à certains égards, ce sont des inverses distribu-
tionnels; autrement dit, nous trouvons de nombreuses phrases comme
N-t buys from N2 : N2 sells to Nt (I bought it from him at the best price I could
get, but he still sold it to me with a profit). Si les environnements de buy et
sell dans notre texte sont semblables aux environnements couplés des
autres textes, nous pourrons quand même, en considération de ces résul
tatsplus généraux, mettre les deux mots dans la même classe d'équival
ence, même les analyser comme étant inverses l'un de l'autre.
ou
De cette façon on peut mettre dans une même classe contextuelle
plus de mots qu'il ne serait possible autrement, et on peut faire usage de
ce qui paraît être des liaisons sémantiques spéciales entre des mots (comme
entre buy et sell ou même entre un verbe transitif et la présence d'un
complément d'objet), sans sortir du cadre d'une étude purement formelle
des occurrences. La raison en est qu'il y a un haut degré de corrélation
entre les différences de sens et les différences de distribution linguistique;
et si, dans les limites d'un texte, on ne peut pas montrer les similitudes