SlideShare ist ein Scribd-Unternehmen logo
1 von 40
Downloaden Sie, um offline zu lesen
Zellig S. Harris
                                                                             Mme Françoise Dubois-Charlier




Analyse du discours
In: Langages, 4e année, n°13, 1969. pp. 8-45.




Citer ce document / Cite this document :

 Harris Zellig S., Dubois-Charlier Françoise. Analyse du discours. In: Langages, 4e année, n°13, 1969. pp. 8-45.

 doi : 10.3406/lgge.1969.2507

 http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1969_num_4_13_2507
Résumé
L'analyse du discours effectue les opérations suivantes sur tout texte suivi, considéré individuellement.
Elle rassemble les éléments (ou séquences d'éléments) dont les environnements à l'intérieur d'une
phrase sont identiques ou équivalents, et les considère comme équivalents entre eux (c'est-à-dire,
membres de la même classe d'équivalence). Le matériau qui n'appartient à aucune classe
d'équivalence est associé au membre (d'une classe) avec lequel son rapport grammatical est le plus
étroit. On divise les phrases du texte en segments, constitués chacun d'une succession de classes
d'équivalence, de façon à ce que chaque segment obtenu soit aussi semblable que possible, par des
classes qui le composent, aux autres segments du texte. On examine alors la succession des segments
pour repérer la distribution des classes qu'elle offre et, en particulier, pour repérer des schémas
d'occurrence de classes.
Ces opérations ne font appel à aucune connaissance concernant le sens des morphèmes, l'intention de
l'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphèmes, y compris les
junctures de phrase et autres intonations morphologiques (ou ponctuation). L'application de ces
opérations peut être renforcée par l'utilisation des équivalences grammaticales (ou rapports
d'occurrence de morphèmes individuels), tirées de toute la langue ou du corps linguistique dont le texte
en question fait partie. Dans ce cas, il est nécessaire de connaître les classes grammaticales des
différents morphèmes du texte.
L'analyse du discours donne une foule de renseignements sur la structure d'un texte ou d'un type de
texte, ou sur le rôle de chaque élément dans cette structure. La linguistique descriptive, elle, ne décrit
que le rôle de chaque élément dans la structure de la phrase qui le contient. L'analyse du discours nous
apprend, de plus, comment un discours peut être bâti pour satisfaire à diverses spécifications,
exactement comme la linguistique descriptive construit des raisonnements raffinés sur les façons dont
les systèmes linguistiques peuvent être bâtis pour satisfaire à diverses spécifications. L'analyse du
discours donne aussi des renseignements sur des fragments de discours plus longs que la phrase;
ainsi, il se révèle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sont
pas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prédicat, etc.), mais
le sont dans le scheme d'occurrence des classes d'équivalence dans les phrases successives.
ZELLIG S. HARRIS
Université de Pennsylvanie




                       ANALYSE DU DISCOURS *




     Cet article présente une méthode d'analyse de l'énoncé suivi (écrit
ou oral) que nous appellerons discours 1. C'est une méthode formelle qui
ne se fonde que sur l'occurrence des morphèmes en tant qu'éléments iso-
lables; elle ne dépend pas de la connaissance que le linguiste qui analyse
peut avoir du sens spécifique de chaque morphème, et elle ne nous apprend
rien de nouveau sur le sens particulier de chacun des morphèmes qui
figurent dans le discours en question. Mais ceci ne signifie nullement que
nous ne puissions pas découvrir autre chose que la manière dont la gram
maire de la langue s'illustre dans ce discours. Car, bien que nous usions de
procédures formelles, proches de celles de la linguistique descriptive,
nous pouvons obtenir sur le texte étudié des renseignements que cette
dernière ne fournissait pas.
     Cette information supplémentaire provient d'un fait fondamental :
l'analyse de l'occurrence des éléments dans le texte n'est faite qu'en
fonction de ce texte particulier; c'est-à-dire en fonction des autres éléments
de ce même texte et non en fonction de ce qui existe ailleurs dans la langue.
En conséquence, nous repérons les corrélations spécifiques des morphèmes
du texte tels qu'ils se présentent dans ce texte et, ce faisant, nous décou
vrons quelque chose de sa structure, de ce qui s'y passe. Il se peut que
nous ne sachions pas exactement ce que le texte dit, mais nous pouvons
déterminer comment il le dit — ce que sont les schemes de récurrence des
principaux morphèmes qui le forment.
     * Cet article est paru en anglais dans Language, vol. 28, 1952, pp. 1-30. Nous remer
cionsM. Z. Harris et la Société de Linguistique d'Amérique qui nous ont autorisés à le
publier en français.
     1. J'ai le plaisir de remercier ici de leur collaboration trois hommes qui m'ont aidé
dans la mise au point de la méthode et dans l'analyse de divers textes : Fred Lukoff,
Noam Chomsky et A. F. Brown. Les recherches antérieures dans la perspective de cette
méthode avaient été présentées par Lukoff dans Preliminary analysis of the linguistic
structure of extented discourse (University of Pennsylvania Library [1948]). Une analyse
détaillée d'un texte-échantillon a paru dans « Discourse analysis : a sample text » de
Z. Harris, Language, vol. 28, n° 4, 1952, p. 474.
9

     On peut déterminer des schemes définis pour des textes donnés, pour
des individus, des styles ou des thèmes donnés. Dans certains cas on peut
tirer des conclusions formelles du scheme spécifique de distribution des
morphèmes dans un texte. Et il est souvent possible de mettre en évidence
des différences de structure régulières entre les discours tenus par des
personnes différentes, ou dans des styles ou sur des thèmes différents.


                              Préliminaires

1. — Le problème.

          On peut envisager l'analyse du discours à partir de deux types de
problèmes qui, en fait, sont liés. Le premier concerne le prolongement de
la linguistique descriptive au-delà des limites d'une seule phrase à la fois.
Le second concerne les rapports entre la « culture » et la langue (c'est-à-dire
entre le comportement non-verbal et le comportement verbal).
          Le premier problème se pose parce que la linguistique descriptive
s'arrête généralement aux limites de la phrase. Ceci ne résulte pas d'une
décision a priori, car les techniques linguistiques ont été élaborées pour
permettre d'étudier tout énoncé, quelle qu'en soit la longueur; mais il se
trouve que, dans toutes les langues, presque tous les résultats obtenus
concernent un type d'énoncé relativement court qu'on peut appeler phrase.
Autrement dit, quand on établit une interdépendance dans l'occurrence
de deux éléments A et B, il se trouve presque toujours que ces deux él
éments       sont considérés comme se présentant dans une même phrase. On
peut dire, par exemple, que les adjectifs anglais se trouvent avant le nom
ou après certains verbes (dans la même phrase) : the dark clouds, the future
seems bright, mais il est rare que nous puissions établir des interdépen
dances dépassent les limites de la phrase, par exemple si le verbe
              qui
principal d'une phrase a tel suffixe de temps, le verbe principal de la
phrase suivante aura tel autre suffixe de temps. Nous ne pouvons pas dire
que, si une phrase est; de la forme NV, la suivante sera de la forme N.
Tout ce que nous pouvons dire, c'est que la plupart des phrases sont de
la forme NV, que quelques-unes sont de la forme N, etc., et que ces
 structures figurent dans diverses séquences.
          C'est ainsi que la linguistique descriptive, partie pour décrire les
occurrences d'éléments dans tout énoncé quelle qu'en soit la longueur,
les décrit finalement surtout en fonction des autres éléments de la même
phrase. On ne s'est pas trop inquiété de cette limitation, parce qu'elle
n'a pas empêché l'élaboration de grammaires adéquates : la grammaire
expose la structure des phrases; le locuteur construit chaque phrase par
ticulière      conformément à cette structure et produit sa propre séquence
 de phrases.
          L'autre problème, celui des rapports entre le comportement (ou
10

 situation sociale) et la langue, a toujours été considéré comme extra
 linguistique.        La linguistique descriptive ne se préoccupe pas du sens des
 morphèmes et, bien qu'on puisse essayer de tourner la difficulté en parlant,
 non de sens, mais de la situation sociale et intersubjective dans laquelle
 l'énoncé est produit, la linguistique descriptive n'est pas armée pour tenir
 compte de la situation sociale : elle peut seulement définir l'occurrence
  d'un élément linguistique en fonction de l'occurrence d'autres éléments
 linguistiques. Les études menées sur les rapports entre la « culture » et la
 langue n'ont donc pas pu bénéficier des travaux distributionnels récents.
 Ainsi, elles font l'inventaire des sens exprimés dans la langue en étudiant
 le stock lexical; ou elles tirent des conclusions du fait que, dans une cer
 taine langue, un certain groupe de sens s'exprime par le même morphème;
 ou elles discutent des nuances de sens et d'emploi d'un mot en le rappro
 chantd'autres (par exemple en stylistique). Elles ont aussi souligné cer
 tains         points comme le fait qu'il faut considérer le sens global des syn-
 tagmes et non la somme des sens des morphèmes qui les constituent :
 ainsi « How are you? » est une formule de politesse plutôt qu'une question
 sur la santé de l'interlocuteur. Cet exemple illustre bien la corrélation
 entre le discours et la situation sociale. De même on a étudié des caracté
 ristiques de la personnalité dans l'énoncé en rapprochant les traits li
nguistiques         récurrents d'un individu avec des traits récurrents de son
  comportement et de sa sensibilité 2.


2. — Distribution a l'intérieur du discours.

      L'analyse distributionnelle ou combinatoire à l'intérieur d'un dis
cours  considéré comme un tout spécifique se révèle pertinente pour l'étude
de ces deux problèmes.
      D'une part, elle nous permet de dépasser la limitation à la phrase
de la linguistique descriptive. Alors que nous ne pouvons pas définir la
distribution des phrases (ou plus généralement une quelconque relation
entre les phrases) dans un ensemble arbitraire de phrases prises dans une.
langue donnée, nous pouvons obtenir des résultats précis sur certaines
relations dépassant les limites de la phrase si nous ne considérons que les
phrases d'un seul discours suivi, c'est-à-dire celles qui ont été prononcées
ou écrites les unes à la suite des autres par une ou plusieurs personnes
dans une seule situation. Cette limitation de l'analyse au discours suivi
n'en diminue pas l'utilité, puisque toutes les occurrences de la langue ont
une cohérence interne. La langue ne se présente pas en mots ou phrases

         2. Nous considérons que les corrélations entre personnalité et langue ne sont pas
simplement liées aux corrélations entre culture et langue, mais qu'elles en sont un cas
particulier. La raison d'être de ce point de vue est que la plupart des caractéristiques
individuelles d'un énoncé (à distinguer des caractéristiques phonétiques) sont en cor
rélation     avec les particularités de personnalité qui proviennent de l'expérience de l'i
ndividu     dans des situations interpersonnelles conditionnées socialement.
11

indépendantes, mais en discours suivi, que ce soit un énoncé réduit à un
mot ou un ouvrage de dix volumes, un monologue ou une discussion
politique. Les ensembles arbitraires de phrases ne présentent en fait
aucun intérêt, si ce n'est pour vérifier la description grammaticale; et il
n'y a rien d'étonnant à ce que nous ne puissions pas trouver d'interdépen
dance        entre des phrases ainsi assemblées. La succession des phrases dans un
discours suivi constitue, au contraire, un domaine privilégié pour les
méthodes de la linguistique descriptive, puisque celles-ci ont pour objet
la distribution relative des éléments à l'intérieur d'un énoncé suivi quelle
que soit sa longueur.
          D'autre part, l'analyse distributionnelle à l'intérieur d'un seul dis
cours,        considéré individuellement, fournit des renseignements sur certaines
corrélations entre la langue et d'autres formes de comportement. La raison
en est que chaque discours suivi est produit dans une situation précise
— qu'il s'agisse d'une personne qui parle, ou d'une conversation, ou de
quelqu'un qui se met de temps en temps à son bureau pendant un certain
nombre de mois pour écrire un type défini de livres dans une certaine
tradition, littéraire ou scientifique. Cette co-occurrence de la situation et
 du discours ne signifie pas, bien entendu, que les discours produits dans
 des situations semblables doivent nécessairement avoir certaines carac
téristiques       , formelles en commun, ni que les discours produits dans des
situations différentes doivent présenter certaines différences formelles;
 elle ne fait qu'expliquer ou permettre l'existence de ces corrélations for
melles.
           Il reste à prouver, à partir de données de fait, que ces corrélations
formelles existent bien en effet, que les discours d'un individu, d'un
groupe social, ou relevant d'un style particulier, ou portant sur un certain
thème, , présentent non seulement des significations propres (dans leur
 choix des morphèmes), mais aussi des traits formels caractéristiques. Nous
ne parlerons pas ici du choix particulier des morphèmes, mais on peut
étudier les caractéristiques formelles de ces discours par des méthodes
distributionnelles appliquées à l'intérieur de chaque texte; et le fait de
leur corrélation avec un certain type de situation donne un statut de
signification! à l'occurrence de ces caractéristiques formelles.


3. — Combinaison, avec la grammaire.

        On voit donc que la méthode présentée ici vient d'une application
des méthodes distributionnelles de la linguistique à un discours à la fois,
considéré comme un tout' spécifique. On peut s'en servir directement sur
un texte, sans faire appel pour son étude à aucune connaissance linguis
tiqueautre que les limites des morphèmes; ceci est possible parce que
l'analyse distributionnelle est une méthode élémentaire, qui consiste sim
plement    à établir l'occurrence relative des éléments qui, dans le cas parti-
12

culier, sont des morphèmes. Pour montrer la validité de la méthode, ou
pour pouvoir éventuellement l'appliquer à un matériau non-linguistique,
il convient de n'utiliser aucune autre connaissance préalable que les
limites des éléments.
          Si cependant nous nous intéressons non seulement à la méthode,
mais encore à ses résultats, si nous voulons l'utiliser pour découvrir tout
ce qu'il est possible de trouver sur un texte particulier, il est utile de la
combiner avec la linguistique descriptive. Dans ce but, il ne faut utiliser
que les règles de la grammaire de la langue en question qui sont vraies
pour toute phrase ayant une forme donnée. Par exemple, à partir de toute
phrase française de la forme Nj V N2 (Ainsi le chasseur tue le lion), on
peut obtenir une phrase où l'ordre des syntagmes nominaux est inverse
N2 — Nx (le lion — le chasseur) en changeant la forme verbale 3, le lion
est tué par le chasseur. Le recours à ce genre d'informations grammaticales,
dans l'analyse d'un texte, se justifie par le fait que, puisque cette règle
s'applique à toute phrase française de la forme N2 V N2, elle doit donc
aussi être applicable à toute phrase de la forme N-|_ V N2 du texte qui nous
intéresse, à la seule condition, naturellement, que ce soit du français. Et
ce recours à la grammaire permet dans bien des cas de pousser plus loin
l'application de la méthode d'analyse du discours.
          Nous verrons ceci plus en détail à la section 7.3.; mais il faut signaler
ici que cet usage de l'information grammaticale ne remplace pas le travail
 qui pourrait être effectué par la méthode d'analyse du discours et n'affecte
 en rien l'autonomie de cette méthode, il ne sert qu'à transformer certaines
 phrases du texte en phrases grammaticalement équivalentes (cf. ci-dessus
 la transformation de Nj V N2 en N2 V* Nx), pour rendre plus aisée l'appli
 cation de la méthode d'analyse du discours, ou pour la rendre possible
 dans certains passages du texte où elle ne l'était pas auparavant. Et nous
 verrons qu'il ne s'agit pas de décider arbitrairement quand et comment
 appliquer ces transformations grammaticales, mais que c'est la structure
 même du texte qui les détermine.
          On peut pousser plus avant encore l'application de la méthode d'ana
 lyse discours dans des textes particuliers si on utilise, non seulement les
          du
 résultats ordinaires de la grammaire, mais si on introduit également dans
 la linguistique descriptive l'étude des distributions spécifiques des mor
 phèmes       individuels; dans certains cas, en effet, comme on le verra à la
 section 7.3., on aimerait pouvoir avoir des renseignements non plus sur
 toute une classe de morphèmes (comme la transformation de tout V en
 V*), mais sur un certain membre de cette classe, sur une restriction d'oc
 currence      qui est vraie pour ce morphème-là, mais non pour les autres; on
 n'a pas toujours à l'heure actuelle de tels renseignements, mais il est pos-

     3. Dans ce cas de transformation du verbe correspondant à une inversion du sujet
(N1 ci-dessus) et de l'objet (N2), on appellera la nouvelle forme verbale « forme conjointe
de la première » et on l'écrira V*. La forme conjointe d'un verbe actif est donc le passif
et vice versa.
13

sible de les obtenir par des méthodes qui, fondamentalement, sont celles
de la linguistique descriptive.
         Enfin, on peut quelquefois pousser plus avant l'application de l'ana
lysedu discours dans des textes particuliers en tirant des renseignements
non seulement de la grammaire de la langue mais aussi d'une analyse des
criptive     de l'ensemble, écrit ou parlé, dont le texte fait partie : on peut
 considérer cette masse plus vaste de matériau comme le dialecte dans
lequel a été écrit ou dit le texte en question, et on peut dire, comme préc
édemment,      que toute conclusion distributionnelle vraie pour toutes les
phrases d'une forme donnée dans ce dialecte est vraie aussi de toute phrase
de cette forme dans le texte en question.



                                La méthode


4. — Nature de la méthode.


        Nous avons soulevé deux questions : celle des rapports distribution-
nels entre les phrases, et celle de la corrélation entre la langue et la situa
tion sociale. Nous avons suggéré qu'on peut obtenir des renseignements
concernant ces deux problèmes grâce à l'analyse formelle d'un discours
pris comme un tout spécifique. Quel genre d'analyse faudrait-il utiliser?
Pour en décider, considérons ce que permet le matériau.
         Puisque le matériau consiste simplement en une séquence de formes
linguistiques disposées en phrases successives, toute analyse formelle se
limite à localiser des éléments linguistiques à l'intérieur de ces phrases,
c'est-à-dire à établir les occurrences d'éléments; à moins d'introduire de
l'extérieur des informations nouvelles, nous ne pouvons pas étudier la
nature ou la composition de ces éléments, où leur corrélation avec des
caractéristiques non-linguistiques.
          Qui plus est, il n'y a pas d'éléments spéciaux qui soient a priori plus
importants que les autres, comme mais, ou je, ou communisme, qui nous
conduiraient à nous intéresser au simple fait de leur absence ou de leur
présence dans notre texte. Toute analyse qui tendrait à découvrir la pré
sence      ou l'absence dans un texte de certains mots particuliers choisis par
le linguiste, serait une recherche sur le contenu du texte, qui reposerait
 finalement sur le sens des mots choisis. Si nous ne nous appuyons pas sur
 le sens dans notre analyse, les seuls morphèmes — ou les seules classes —
que nous puissions traiter séparément sont ceux qui présentent des parti
cularités     de distribution établies grammaticalement.
          Puisque nous ne nous intéressons donc pas, en général, à tel ou tel
élément choisi à l'avance, mais bien aux éléments qui figurent dans le
 texte, il est évident que nous ne voulons pas simplement affirmer tauto-
14

  logiquement qu'ils figurent; nous chercherons à établir empiriquement
  comment ils figurent, — lesquels se trouvent toujours à côté de quels
  autres, ou dans le même environnement que quels autres, etc., — c'est-
  à-dire l'occurrence relative de ces éléments les uns par rapport aux autres»
  En ce sens notre. méthode se rapproche» plus de celle queJ!on< utilise pour
  élaborer la grammaire d'une langue (qui établit; les. rapports distribution-
  nels entre les .éléments), que de celle que l'on (utilise pour en j élaborer le
• dictionnaire (qui dresse la liste de tous les éléments de cette langue, sans se
  préoccuper de, leurs .positions).
       Enfin, puisque, le matériau est une suite -finie de. phrases, ce que nous
  aurons établi sur la distribution.de chaque élément ne peut être valable que
  dans les limites de cette séquence de phrases — que ce soit un paragraphe
  ou un livre. Nous verrons plus loin (7.3.) qu'on peut parfois utiliser des
  renseignements concernant la distribution d'un élément hors du texte consi
  déré; mais ceci ne peut être qu'un auxiliaire extérieur, à n'utiliser que
  lorsque la distribution de cet élément dans le texte a été complètement
  établie.



5. — Aperçu général de la méthode.


      Il résulte de tout ce qui précède que notre méthode devra établir
les occurrences d'éléments et en particulier les occurrences relatives de tous
les éléments d'un discours dans les limites de ce seul discours.

     5.1. Éléments dans des environnements identiques.

     Pour satisfaire à cette nécessité, nous pourrions. formuler de façon
détaillée la distribution de chacun des éléments dans le discours — de
même qu'en linguistique descriptive nous pourrions établir des formules
individuelles rendant compte de tous les environnements (c'est-à-dire de
la distribution) de chaque élément dans les différentes phrases d'une
langue. Mais ces formules individuelles sont de dimension impossible
pour toute une langue et, même pour un seul texte, elles sont difficiles
à manier. De plus, dans les deux cas, elles ne constituent pas une base
satisfaisante pour procéder à une analyse comparée et pour en déduire des
conclusions générales. C'est pourquoi, dans l'analyse du discours, comme
en linguistique descriptive, on regroupe les éléments qui ont des distribu
tions semblables en une classe et, à partir de là, on parle de la distribution
de la classe considérée comme un tout plutôt que de celle de chacun des
éléments pris séparément.
     Quand deux éléments ont des distributions identiques, cette opération
de regroupement ne présente aucune difficulté. En linguistique descriptive,
cependant, c'est rarement le cas, car peu de mots ont des distributions
15

identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus fr
équemment   dans un texte répétitif, où deux mots peuvent être toujours
employés dans des phrases parallèles identiques — comme par exemple
dans les légendes à style en écho, dans les proverbes, dans les slogans, ou
dans les rapports scientifiques « secs », mais précis.

     5.2. Éléments à environnements équivalents.
            Il est plus fréquent que deux éléments se présentent dans des env
ironnements          qui sont presque identiques, sans l'être tout à fait; nous pour
rons peut-être alors les regrouper en une seule classe distributionnelle
en dressant une chaîne d'équivalences qui lie les deux environnements
presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand
on dit, par exemple, qu'en. français la classe des adjectifs A se rencontre
après la classe des noms N, en dépit du fait qu'un certain A (courageuse
par exemple) peut ne jamais figurer après un certain N (table par exemple).
C'est ce qu'on fait en analyse du discours quand on dit que deux parties
de l'énoncé, qui ont le même environnement à un endroit, sont équivalentes
même en un autre endroit où elles n'ont pas le même environnement.
            Supposons par exemple que le texte contienne les quatre phrases
suivantes :
     Ici les feuilles tombent vers le milieu de l'automne
     Ici les feuilles tombent vers la fin du mois d'octobre
     Les premiers froids arrivent après le milieu de l'automne
     Nous commençons à chauffer après la fin du mois d'octobre.
            Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre
 sont équivalents parce qu'ils se présentent dans le même environnement
 (Ici les feuilles tombent vers) et que cette équivalence passe dans les
phrases 3 et 4. Ceci posé, on peut aller plus loin et dire que Les premiers
froids arrivent et Nous commençons à chauffer se présentent dans des env
ironnements        équivalents (le mot en supplément après est identique dans
les deux environnements). L'élaboration de ces chaînes, qui font passer
l'équivalence de deux parties de l'énoncé d'une paire de phrases où leur
environnement est vraiment identique, à une autre paire de phrases où
il ne l'est pas, doit naturellement présenter de sérieuses garanties, sinon
tout devient équivalent à tout et l'analyse s'effondre. On a le même pro
blème        quand on établit les classes en linguistique descriptive. Nous verrons
plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse
du discours.
            De façon plus générale, si nous avons dans notre texte les séquences

     4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi
pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le
reste, mais qui contient Jim à la place de Bill.
     5. Des travaux inédits de N. Chomsky m'ont aidé à mieux comprendre l'usage de
ces chaînes.
16

AM et AN, nous dirons que M est équivalent à N, ou que M et N se pré
sentent       dans un même environnement A, ou que M et N se présentent tous
deux comme l'environnement d'un même élément (ou séquence d'éléments)
A; et nous écrirons M = N. Si nous trouvons alors dans notre texte BM et
CN (ou MB et NC), nous dirons que B est équivalent à C (au second degré),
puisque B et C se trouvent dans des environnements M et N, dont nous
avons établi l'équivalence, et nous écrirons B = C. Puis, si nous trouvons
BK et CL, nous écrirons K = L, puisqu'ils se trouvent dans les environ
nements B et C équivalents au second degré, et ainsi de suite. A titre
d'exemple, continuons notre fragment de texte par la phrase suivante :
Nous avons toujours des tas d'ennuis quand nous commençons à chauffer,
mais il faut bien être prêt quand les premiers froids arrivent. Nous dirons
que Nous avons toujours des tas d'ennuis est équivalent (dans ce texte)
à mais il faut bien être prêt.
        Dire que B = C ne veut pas dire qu'ils sont égaux en général, ni qu'ils
signifient la même chose; on utilise le signe = pour l'unique raison que
le rapport entre B et C satisfait aux exigences techniques du rapport
communément symbolisé par ce signe; quand nous posons B = C, cela
signifie seulement que ce rapport est une étape dans une chaîne d'équiva
lencesd'une part B et C se rencontrent dans des environnements équi
            :
valents       (M et N); d'autre part deux environnements (K et L), quels qu'ils
soient, dans lesquels se trouvent B et G seront considérés équivalents.
         Il ne sert à rien de soulever des questions comme « Est-il vrai que
B = C? » ou « A-t-on le droit de dire que K = L, simplement parce qu'on
a B = G et qu'on trouve BK et CL? ». Tout ce que nous proposons ici est
une méthode d'analyse, les seules questions pertinentes sont de savoir
si la méthode est utilisable et si elle conduit à des résultats intéressants
 et valables. On jugera si la méthode est utilisable en se fondant sur ses
 opérations, sans se préoccuper de ses résultats, que nous n'avons pas
 encore vus. Quant aux résultats, nous en étudierons l'intérêt aux para
 graphes       8, 9 et 10, où nous verrons que les chaînes d'équivalences révèlent
 une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le
 « droit » de poser K = L, puisque tout ce que nous signifions par K = L
 est qu'on trouve BK et CL et que B = C; la justification viendra du fait
 qu'en regroupant toutes les équivalences, on trouve quelque chose sur la
 structure du texte.

     5.3. Classes d'équivalences.
         Après avoir établi quelles sont les séquences qui se rencontrent dans
des environnements équivalents, nous pouvons les regrouper en une seule
classe d'équivalence. Nous avons les formules A = B (tous deux se ren
contrent     devant N) et B = C, nous considérerons donc A, B et C comme
membres d'une même classe d'équivalence. De même, M, N, K, L sont tous
membres d'une autre même classe d'équivalence. Reprenons notre
exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent après
17

(To) et Nous commençons à chauffer après (T3) sont tous trois membres d'une
classe d'équivalence T, tandis que le milieu de V automne (Ex) et la fin du
mois d'octobre (E2) sont membres d'une autre classe d'équivalence E. Il
y a encore une troisième classe d'équivalence E' composée de nous avons
toujours des tas d'ennuis quand et mais il faut bien être prêt quand. Il y a
visiblement un rapport entre E' et E puisque tous deux se rencontrent avec
les deux derniers membres de T. Mais E se trouve après T, tandis que
E' se trouve avant T.
     En fonction de ces classes, on peut écrire les cinq phrases du fragment
de texte en six formules (la dernière phrase est double) : TE, TE, TE, TE,
E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe,
mais on peut dire que, quand l'ordre de E et T est inversé (quand E se
réfléchit dans T), on a E' à la place de E. Si on modifie les membres de E'
pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le
précéder, ils deviennent des membres réguliers de E. Par exemple, on
pourrait dire Nous commençons à chauffer avec toujours des tas d'ennuis
mais les premiers froids arrivent si brusquement qu'il faut bien être prêt.
Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours
beaucoup d'ennuis est un membre deE en vertu de son occurrence après T;
appelons le E3; il faut naturellement montrer qu'il est équivalent à Nous
avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse
par rapport à T; nous verrons au paragraphe 7.3. à quelles techniques
on fait appel pour établir cette équivalence. De même il faut montrer que
le nouveau syntagme E « mais... si brusquement qu'il faut bien être prêt
(E4) est le réfléchi dans T du syntagme E' mais il faut bien être prêt quand.
Si on peut établir ces deux équivalences, on peut remplacer les deux
syntagmes E' par les syntagmes modifiés qu'on obtient quand on les
met en position E. Nous obtenons par conséquent deux membres de
plus dans E, et la classe E' n'existe plus.
      On peut ainsi dresser des classes d'équivalence (comme E) de toutes
les séquences qui ont des environnements équivalents, à l'intérieur du
texte, c'est-à-dire les mêmes classes d'équivalence d'un même côté (avant
ou après). Les éléments (ou séquences d'éléments) qui appartiennent à
la même classe d'équivalence sont dits équivalents les uns aux autres, ou
substituts les uns des autres : nous verrons plus loin (paragraphe 10) que,
par certains côtés (en particulier dans les extensions du texte), on peut les
considérer comme interchangeables ou substituables; dans ce cas la classe
d'équivalence peut aussi s'appeler une classe de substitution.
      11 est à remarquer que l'opération consistant à grouper dans une même
classe d'équivalence des formes non identiques, ne repose pas sur le fait
que leurs petites différences de sens sont considérées comme négligeables,
mais sur le fait qu'on les trouve dans des environnements équivalents,
 ce qui signifie qu'on les trouve soit dans des environnements identiques
 (le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux
 dans l'environnement les feuilles tombent vers), soit dans des environne-
18

ments qui sont aux extrémités d'une chaîne d'équivalences garantie
(Les premiers froids arrivent et Nous commençons à chauffer se trouvent
dans les environnments équivalents après le milieu de l'automne et après
la fin du mois d'octobre). Notre méthode est donc essentiellement celle de
la linguistique descriptive et non celle de la sémantique.

     5.4. Ordres de phrase.
      Nous en arrivons maintenant à une opération que n'emploie pas la
linguistique descriptive, à savoir la représentation de l'ordre des occur
rences successives des membres d'une classe. En linguistique descriptive,
le seul ordre considéré est la position relative des différentes parties d'une
 séquence : on décrit, par exemple, l'ordre de l'article et du nom en disant
 que le premier précède le second dans la chaîne du syntagme nominal.
Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties
de la phrase, par exemple les ordres différents de E et E' par rapport à T.
      L'ordre des phrases successives ou d'une certaine classe de mots dans
différentes phrases (par exemple la relation entre des sujets successifs)
n'intéresse généralement pas la linguistique descriptive, car les formules
distributionnelles qu'elle définit ne s'appliquent normalement qu'à l'inté
rieur d'une seule phrase à la fois. Dans notre cas cependant, où il s'agit de
tout un discours, le problème existe. Si nous considérions chaque phrase
séparément, en ne la rapprochant des autres que pour comparer des struc
tures, nous pourrions dire (comme en linguistique descriptive) que chacune
des phrases de notre fragment de texte consiste en TE. Mais, puisque nous
considérons le texte comme un tout, nous ne pouvons dire qu'il consiste
simplement en 6 fois TE : les membres de E et de T sont différents dans les
diverses phrases; et leurs différences preuvent être particulières à ce texte,
ou à un groupe de texte semblables.
      Nous pouvons représenter structurellement notre fragment de texte
par un tableau à double entrée, l'axe horizontal représentant la matière
qui se présente à l'intérieur d'une seule phrase ou sous-phrase, l'axe ver
tical (ici divisé en 2 parties) représentant les phrases successives.

                        Ti Ex                T3 E2



Dans ce tableau à double entrée, les différents symboles dans la rangée
horizontale représentent les différentes parties d'une seule phrase ou
sous-phrase du texte, dans l'ordre dans lequel elles se présentent dans
la phrase (sauf dans la mesure où l'ordre a été modifié par des transfor
mations explicites comme pour le passage de E' à E). Les colonnes verti
cales indiquent les différents membres d'une classe d'équivalence, dans
l'ordre d'apparition des phrases où ils figurent.
     Le fait que l'ordre des symboles d'une rangée puisse être différent de
l'ordre des éléments dans la phrase correspondante tient à ce que nos
19

connaissances linguistiques de la structure de phrase nous permettent
de traiter les éléments indépendamment de leur ordre. C'est ce que nous
faisons quand nous ne tenons pas compte dans nos symboles d'un ordre
automatique et qui réapparaîtrait dès la retraduction de nos symboles en
langue, — par exemple nous incluons mais... dans E4 même s'il en est
nécessairement séparé dans la phrase réelle (puisque mais se trouve géné
ralement        au début d'une structure de phrase, quelle que soit la partie
de la phrase à laquelle il se rapporte). C'est ce que nous faisons également
quand nous remplaçons un certain ordre non automatique à valeur mor
phologique        par les morphèmes qui sont grammaticalement équivalents
à cet ordre : ainsi quand, par exemple, nous remplaçons NXV N2 par
N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tué par
le chasseur) ou quand, dans notre fragment de texte, nous remplaçons
 E' avant T par E après T.
           Contrairement au traitement cavalier de l'ordre horizontal, nous ne
 pouvons rien changer à l'ordre dans une colonne verticale : nous n'avons
 là aucune connaissance linguistique a priori qui nous dise quels agence
 ments de phrase sont automatiques (s'il y en a) et par conséquent à ne pas
 représenter, ni quels agencements peuvent être remplacés par des agen
 cements       différents, mais équivalents. Une étude plus approfondie des
 séquences de phrases dans la langue nous donnera peut-être un jour des
 indications à ce sujet; elle établira peut-être, par exemple et pour prendre
 un cas très simple, que des séquences de phrases de la forme P parce
 que Q sont équivalentes à des séquences de la forme Q donc P, ou que
 P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'être
 pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une étude
 approfondie d'un certain texte ou de plusieurs textes d'un certain type
 montrera peut-être que certaines séquences de phrases tout entières
 sont interchangeables ou équivalentes; et, grâce à ces données, nous
 pourrons peut-être simplifier l'axe vertical du tableau à double entrée,
 en trouvant par exemple des schemes verticaux qui reviennent périod
 iquement.       En attendant, l'axe vertical reste une reproduction exacte
 de l'ordre des phrases ou sous-phrases du texte.

     5.5. Résumé.
        Nous pouvons maintenant avoir un aperçu général de la méthode.
On dira que des éléments (parties de texte — morphèmes ou séquences de
morphèmes) sont équivalents entre eux s'ils se présentent dans l'env
ironnement    d'autres éléments identiques ou équivalents. Tout ensemble
d'éléments équivalents entre eux s'appelle une classe d'équivalence.

     6. Les mathématiques, et plus encore la logique, ont déjà établi des ordres de
phrase spécifiques qui sont équivalents. On peut redécouvrir linguistiquement cette
équivalence en trouvant que la distribution de chaque phrase est équivalente à celle
des autres. Mais nous cherchons plutôt ici à découvrir d'autres équivalences que celles
que nous savons déjà faire partie du système.
20

Chaque phrase successive du texte est alors représentée par une séquence
de classes d'équivalence, celles auxquelles ses différentes parties appar
tiennent.     Nous obtenons ainsi pour tout le texte un tableau à double
entrée, l'axe horizontal représentant les classes d'équivalence contenues
par une seule phrase, l'axe vertical représentant les phrases successives.
Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.),
mais des schemes d'occurrence des classes d'équivalences dans tout le
texte.
        Si les différentes phrases contiennent des classes entièrement diffé
rentes,     ce tableau n'a pas d'intérêt; mais ce n'est généralement pas le
cas. Il y a, dans presque tous les textes, des passages où certaines classes
d'équivalence se répètent, dans les phrases successives, en un scheme
caractéristique. Le tableau permet d'étudier ce scheme et on peut en
tirer divers types d'information sur le texte, certaines analyses structur
elles texte et certaines exégèses sur le texte. Pour les classes d'équi
          du
valence,     qui ont été établies distributionnellement, le tableau en montre
la distribution. Pour le texte dans sa totalité, le tableau montre certaines
caractéristiques de structure.


6. — Mode opératoire.

    Nous allons maintenant montrer la procédure en détail, en appli
quant la méthode à un texte spécifique, d'un type très courant aujour
d'hui7.
                               Millions Can't Be Wrong
     Millions of consumer bottles of X- have been sold since its introduction
a few years ago. And four out of five people in a nation wide survey say they
prefer X- to any hair tonic they've used. Four out of five people in a nation
wide survey can't be wrong. You too and your whole family will prefer X-
to any hair tonic you've used! Every year we sell more bottles of X- to satis
fiedcustomers. You too will be satisfied!

     6.1. Détermination des classes d'équivalence.
    La première étape dans l'analyse du discours consiste à décider quels
éléments doivent être considérés comme équivalents, donc placés dans la
même colonne du tableau. Ce n'est pas toujours automatique, il ne s'agit
pas simplement de trouver ceux des éléments qui ont des environne-

     7. Ceci est le texte authentique d'un slogan, que nous avons trouvé sur une carte,
qui selon toute vraisemblance, était accrochée à une bouteille de lotion capillaire. Un
très grand nombre de slogans ont été analysés, car ils offrent un matériau clair et répét
itif qui est relativement facile à manier, au stade où nous en sommes arrivés dans
l'analyse du discours. On a aussi analysé de nombreux autres types de textes — des
fragments de livres scolaires, de conversations, d'essais littéraires, etc., qui feront l'objet
d'une prochaine publication.
21

 ments identiques, car 1° il peut y avoir plusieurs façons de couper une
 phrase en parties équivalentes; et 2° il nous faut déterminer dans quelle
 direction chercher les chaînes d'équivalence qui sont moins évidentes.
           Le point de départ le plus simple est d'examiner les mots du texte
 qui sont le plus souvent répétés : presque tous les textes contiennent des
mots très souvent répétés 8, qui sont souvent les mots-clés du texte. On
 peut en toute certitude mettre dans une seule colonne, c'est-à-dire dans
 une seule classe d'équivalence, les diverses occurrences de chacun de ces
mots. Et on peut mettre dans une seule autre classe d'équivalence les
mots voisins du mot-clé puisqu'ils se présentent dans des environnements
 identiques. Dans notre texte, il n'y a pas apparemment de mots-clés;
mais nous pouvons partir de la séquence répétée can't be wrong, identique
et donc naturellement équivalente : Millions est alors équivalent (pour
 ce texte) à Four out of five people in a nation wide survey, puisque tous
 deux se trouvent devant can't be wrong.
           Cette première étape pourrait aussi, bien entendu, être effectuée
pour des mots répétés tels que of. Mais si nous devions regrouper tous les
environnements du mot of, nous ne pourrions pas utiliser la classe d'équi
valence qui en résulterait pour construire une chaîne d'autres équivalences,
car on ne trouverait rien d'autre dans leur environnement. Tandis que
la classe contenant millions et four out of five, que nous obtenons à partir
des répétitions de can't be wrong, se révélera, dans les paragraphes sui
 vants,      liée à d'autres parties de ce texte.
           En utilisant ainsi les répétitions, nous en venons à construire des
chaînes d'équivalence : nous nous demandons quels autres environnements
se présentent pour millions et four out of five... Pour millions nous avons
un autre environnement, à savoir of consumer bottles, etc., mais nous
verrons plus tard (paragraphe 9) que cet environnement s'oppose aux
 environnements de four out of five; nous laisserons donc provisoirement
de côté la séquence of consumer bottles, etc. Quant à Four out of five in
a nation wide survey, nous le trouvons dans un autre environnement
say they prefer X- to any hair tonic they 've used.
           Nous suivons cette chaîne d'équivalence en cherchant un autre env
ironnement        dans lequel say they prefer X- se trouve; il y a bien une autre
occurrence de cette séquence, mais elle se différencie de la première par
you à la place de they. A première vue, il paraît donc impossible de consi
dérer ces deux séquences comme équivalentes, puisque notre méthode
ne donne aucune technique d'approximation, aucun moyen d'estimer
une différence plus ou moins grande, qui puisse nous permettre de

            8. Ceci est même vrai, bien qu'à un moindre degré, dans des textes écrits par ceux
qui respectent les consignes scolaires concernant l'emploi des synonymes pour éviter
les répétitions. Dans ce cas, on trouvera souvent les synonymes dans les mêmes env
ironnements         que le mot originel à ne pas répéter. Au contraire, quand un auteur a inten
tionnellement         utilisé un mot différent pour exposer une nuance particulière de sens que
ce mot exprime, il y aura souvent une différence correspondante entre les environ
nements du synonyme et du mot originel.
22

 dire que ces deux séquences sont assez semblables pour être considérées
 comme équivalentes. En fait, puisque nous n'opérons pas sur le sens des
morphèmes, le remplacement de they par you pourrait constituer une
 différence importante (comme ce serait le cas si tout le texte traitait de la
 distinction entre you et they). Telles quelles, ces deux séquences ne seraient
donc pas rapprochées par notre méthode; tout ce que cette méthode
pourrait faire, serait de trier les parties identiques et les parties diffé
rentes.         En fait il se trouve cependant qu'un examen un peu plus appro
fondi montre que ces deux séquences sont contextuellement identiques
— c'est-à-dire identiques quant à leur environnement pertinent ou
 contexte. On verra cela au paragraphe 7.1.
            Dans l'élaboration des chaînes d'équivalence, il importe de se confor
mer         rigoureusement aux exigences formelles de la méthode, ceci constitue
la première garantie; si nous ne faisons jamais d'approximations, si nous
ne négligeons jamais une « petite » différence dans l'environnement, nous
serons assurés que deux membres quelconques d'une même classe d'équi
valence ont au moins un environnement en commun. Si nous voulons
mettre dans une même classe deux éléments alors qu'aucun environne
ment          de l'un n'est identique à un environnement de l'autre, il nous faudra
ajouter à la méthode un postulat explicite, qui rendra égaux deux env
ironnements          ou neutralisera leur différence.
            Il faut enfin examiner, quand on se demande s'il faut inclure ou non
deux éléments dans une même classe d'équivalence, comment fonctionner
ait, l'analyse du texte, la classe qui résulterait de cette inclusion,
             dans
c'est-à-dire le genre de tableau à double entrée que l'on obtiendrait en
utilisant cette classe : ce facteur doit jouer un rôle, car il y a souvent
plusieurs chaînes d'équivalence possibles qui satisfont à la méthode. Il
ne s'agit pas de considérer des critères externes, comme la longueur de
la chaîne par exemple; il s'agit plutôt de chercher une distribution syst
ématique          des classes, c'est-à-dire d'essayer d'établir en termes de ces
classes un certain fait structurel sur le texte. Autrement dit, nous essayons
de dresser des classes telles qu'elles aient une distribution intéressante
pour notre texte. On pourrait penser que c'est une garantie plutôt cir
culaire        pour la construction des chaînes d'équivalence; mais cela signifie
simplement que toutes les fois que nous devons décider s'il faut pousser
plus loin une chaîne d'équivalence, nous étudions comment le nouveau
jalon s'inscrira dans notre texte analysé, tel qu'il se présentera une fois
représenté en fonction de cette nouvelle classe. On utilise aussi ce genre
de considération en linguistique descriptive quand on doit décider, par
exemple, jusqu'où aller dans la subdivision d'une séquence phonologique
en morphèmes 9.

      9. Cf. Methods in structural Linguistics, p. 160, de Harris (Chicago, 1951). Il va sans
dire que cet emploi vague de la prévision est une formulation préliminaire. Des analyses
poussées montreront ce que l'on peut attendre des différents types de chaînes d'équi
valence, et permettront ainsi une formulation plus précise des garanties.
23

        On pourrait demander de quel droit nous mettons deux mots dans
une même classe d'équivalence pour l'unique raison qu'ils se présentent
tous deux dans le même environnement. Ce à quoi nous répondrons que
la classe d'équivalence indique seulement ce que font distributionnelle-
ment ses membres dans le texte : si, dans ce texte, deux mots ne se pré
sentent    que dans des environnements identiques ou équivalents, alors,
dans ce texte, il n'y a pas de différence dans leur distribution (à part leur
ordre dans la colonne, qui est préservé). Nous ne nions pas qu'il puisse y
avoir des différences de sens ou de distribution en dehors de ce texte.
        Nous avons jusqu'ici reconnu deux classes d'équivalence. L'une,
que nous appellerons P, contient pour l'instant :
     Millions
     Four out of five people in a nation wide survey
l'autre, que nous appellerons W, contient pour l'instant :
     Can't be wrong
     sag they prefer X- to any hair tonic they've used.

    6.2. Segmentation.
        Dès que nous voyons à peu près quelles classes d'équivalence nou&
voudrions expérimenter dans notre texte, nous le divisons en segments
successifs de manière à avoir, dans chaque segment, des occurrences
semblables des mêmes classes d'équivalences. Si nous avons jusqu'ici les
classes P et W et si nous avons quelques successions de la forme PW,
nous essayons de les diviser en segments contenant chacun exactement un P
et un W. Par exemple, le titre du slogan est représenté par PW. La pre
mière     phrase après le titre paraît contenir un P (le mot Millions), mais le
reste de la phrase n'est pas égal à W et ne le contient pas; on laisse
donc la phrase non analysée, et même son P est-il douteux.
        L'appartenance d'un élément à une classe particulière dépend tou
jours de l'appartenance de son environnement. Les éléments ne se défi
nissent     qu'en fonction de leur environnement. Ainsi donc, il se pourrait
que le Millions de cette phrase ne soit pas le même mot que le Millions
du titre. En linguistique descriptive, deux segments identiques du point
de vue phonologique ne constituent un même morphème que s'ils figurent
dans la même classe de morphèmes : il faudrait probablement considérer
sun (soleil) et son (fils) comme le « même » morphème, au même titre
que table (de bois) et table (de logarithmes); s'ils figurent dans des classes
de morphèmes différentes, comme par exemple sea (mer) et see (voir),
ils ne sont certainement pas le même morphème; et si nous voulons ne pas
faire disparaître le rapport entre (a) table (une table) et (to) table (tabul
er)     nous devons distinguer des morphèmes classés et des morphèmes non
classés, et dire que le morphème non classé table figure à la fois dans la
classe N et dans la classe V. De la même façon, si nous rencontrons Mill
ions deux fois, nous essayons de le considérer comme un « même » mor-
24

 phème répété (donc de la même classe), et de considérer ainsi ses deux
 environnements comme équivalents. Mais il se peut que nous découvrions
 ensuite qu'on obtient une meilleure analyse du texte en ne considérant
 pas ces deux environnements comme équivalents (parce que le premier
 environnement est équivalent à une certaine séquence A dans le texte,
 tandis que le second est équivalent à une autre séquence B, qui n'est pas
 équivalente à A). Ainsi donc il se peut que nous ayons à considérer les
 deux occurrences de millions comme appartenant à deux classes diffé
 rentes.    Nous verrons à la section 9 que c'est bien le cas ici.
         ReVenons-en à notre segmentation. La deuxième phrase du texte
 est PW, et la troisième PW. Nous essayons donc de segmenter notre texte
 en tranches successives contenant chacune exactement PW et pas plus.
 Ces tranches seront alors les rangées successives de notre tableau à double
 entrée. Il s'agira souvent d'une phrase entière, mais pas nécessairement :
les différentes sections d'une phrase composée, chacune ayant sa propre
structure de phrase (comme les deux E'T du paragraphe 5.3.), peuvent
aussi constituer des tranches. Mais toute autre portion de la phrase peut
aussi constituer une de ces tranches. Par exemple, si nous avions dans
notre slogan la phrase : Millions of people — four out of five — can't
be wrong when they say they prefer X, qui, telle qu'elle est là, paraît consis
ter PPWW, nous essaierions de la réduire à deux segments PW.
       en
Ces segmentations, moins évidentes, demandent la plus grande attention,
car nous voulons non seulement que les occurrences de P et W soient les
mêmes dans chaque segment, mais aussi que le rapport entre P et W
soit le même. Quand, dans une suite de phrases, chaque phrase tout entière
se réduit à PW,le rapport entre P et W dans chaque segment est le même;
la linguistique descriptive nous apprend que c'est le rapport entre sujet
et prédicat. Nous n'avons pas besoin d'utiliser ce renseignement spéci
fique pour analyser notre texte en PW successifs, mais nous tenons pour
acquis que, quel que soit le rapport entre P et W dans un segment, il est
le même dans tous les autres segments. Sans quoi il serait faux de dire,
en face d'un tableau à double entrée, comme les TE successifs du para
graphe     5.4., que les segments successifs sont identiques pour ce qui est
de T et E. Nous verrons aux paragraphes 7.2. et 7.3. les techniques
permettant de vérifier que le rapport entre les classes d'équivalence de
chaque rangée est le même.

     6.3. Séries de segments semblables.
         On ne réussira généralement pas à diviser tout un texte en segments
contenant les mêmes classes d'équivalence (dans le même rapport les
unes par rapport aux autres). Il peut y avoir ici et là des phrases qui
tout simplement ne contiennent pas ces classes : elles peuvent se révéler
être des phrases d'introduction ou des ramifications d'une autre série
de classes d'équivalence. Et le texte peut être constitué de morceaux suc
cessifs,    sortes de sous-textes à l'intérieur du texte principal, comme des
25

 paragraphes ou des chapitres contenant chacun ses propres classes d'équi
 valence différentes de celles des autres morceaux.
        En cherchant les segments qui contiennent les mêmes classes, on
 découvrira les limites de cette appartenance à une même classe, c'est-
 à-dire les endroits où l'on obtient des fragments du texte contenant des
 classes différentes. En règle générale un texte ne se réduira donc pas à
 une seule série de rangées identiques (chaque rangée, comme TE, repré
 sentant   un fragment contenant les mêmes classes d'équivalence), mais à
 une succession de séries de rangées identiques à l'intérieur de chaque série
 avec, ici et là, des rangées individuelles et différentes.
       Ayant obtenu ce résultat, nous comparons alors les différentes séries
et rangées individuelles, pour voir leurs ressemblances et leurs différences
 en ce qui concerne l'agencement de leurs classes, que les classes spéci
 fiques soient différentes ou non. Nous essayons de découvrir des schemes
dans l'occurrence de ces ressemblances au cours de la succession des séries
et des rangées individuelles. Par exemple, supposons un texte de la
forme AB TE TE TE A'B' EP EP AB KD LM LM K'D' MS MS MS
FBV MS. Si nous utilisons des crochets pour représenter une série de
fragments de la même forme en laissant momentanément BV de côté,
nous pouvons alors représenter le texte par AB [TE] A'B' [EP] AB KD
[LM] K'D' [MS]. Nous remarquons alors que AB [TE] A'B' [EP] et KD
[LM] K'D' [MS] sont structurellement identiques : tous deux sont de
la forme w [xy] w' [yz]; c'est un rapport particulier entre w, x, y et z;
notre texte consiste en deux occurrences de cette structure, plus une
deuxième apparition du w de la première occurrence (c'est-à-dire le AB)
entre les deux structures (ou avant la seconde structure), et plus un FBV
unique avant la fin de la dernière structure.


7. — Techniques auxiliaires.

     Il faut affiner et compléter la procédure centrale, que nous venons de
voir, à l'aide de plusieurs techniques auxiliaires.

     7.1. Occurrence indépendante.
          La distribution des classes d'équivalences (leur scheme d'occur
rence)et la segmentation en fragments qui les contiennent, dépendent de
ce que nous reconnaissons être une occurrence d'un élément. A première
vue, cela peut paraître tout simple : dans la suite Say they prefer X- to
any hair tonic they've used before, nous trouvons évidemment say une fois,
they deux fois, etc., En y regardant de plus près cependant nous voyons
que toutes les occurrences des éléments ne sont pas indépendantes : cer
tains      éléments ne se trouvent, dans un environnement donné, qu'en pré
sence       d'un autre élément. Cette situation est connue en linguistique des
criptive;      par exemple le 5- de he walks n'est pas pris comme élément
indépendant, mais comme une co-occurrence automatique de he, par
26

comparaison avec / walk, you walk 10; et dans des formes comme both
he and I, la présence de both entraîne toujours celle de and, si bien qu'on
peut considérer both ... and comme un seul élément — et non comme
deux éléments. De la même façon, si dans un texte nous trouvons des
éléments identiques (répétés) ou différents, dont l'un n'apparaît que si
l'autre est présent, nous concluons que ces occurrences ne sont pas indé
pendantes       l'une de l'autre et nous indiquons leur occurrence combinée
comme un seul élément dans notre représentation du texte.
          Pour they prefer X- to any hair tonic they've used nous ne pouvons le
comparer qu'à you too and your whole family will prefer X- to any hair
tonic you've used. Dans les deux cas, ce qui vient avant prefer contient le
mot qui précède 've; nous pouvons donc dire que le mot qui précède 've
n'est pas indépendant ou, plutôt, que le choix de l'un des deux membres
du groupe they /you dépend de celui des deux mots de ce groupe qui se
trouve devant prefer. Si le signe Q représente la répétition du membre
du groupe they /you qui se trouve dans ce qui précède prefer, on a :
       U     X     J I J X                      XX
     they prefer X- to any hair tonic Q've used
     You... will prefer X- to any hair tonic Q've used.
     Maintenant que nous avons réduit ces énoncés à leurs éléments
indépendants, nous constatons que leurs dernières parties sont devenues
identiques; par conséquent les premières parties des deux phrases se
trouvent dans des environnements identiques, elles sont donc équival
entes; puisque la première appartenait à la classe P, la seconde you too...
appartient aussi à P u.
     Ceci était un type d'occurrence liée; il y en a bien d'autres sortes
qu'il faut étudier; et les enseignements tirés de cette étude sont utiles
à la fois pour l'analyse du discours et pour une linguistique descriptive
 plus détaillée.
     Les pronoms en offrent un exemple important. Si le slogan avait dit
you... will prefer it, au lieu de you... will prefer X-, nous commencerions
par considérer it comme un nouvel élément, à placer dans une nouvelle
classe d'équivalence. Mais, en fait, l'occurrence de it dépend de l'occur
rencede X- : si le X précédent avait contenu le morphème de pluriel
(X-s), le pronom dans cette phrase aurait été them. D'autres mots du
groupe de it, comme he ou you, ne peuvent figurer tant que X- apparaît
dans la phrase précédente. Il en est de même pour des mots comme
      10. Le s fait aussi partie de tous les noms singuliers (The child walk-s, etc.). Ou on
peut également considérer que walks, goes, etc., sont des variantes de walk, go, etc.
après he et les noms singuliers.
      11. Avant d'en venir là, il faut effectuer un certain nombre d'autres opérations pour
réduire Four out of fives... say they prefer... à deux séquences PW : Four... say... et they
prefer..., la phrase You... will prefer... étant une troisième séquence PW. Sinon, les mots
say they resteraient, puisque la séquence P (équivalente à millions) est seulement Four
out of five people in a nation wide survey, et puisque la séquence W corrigée (identique
au W de You... will prefer) est seulement prefer X- to any hair tonic Q've used (cf. para
graphe 9).
27

 this /these, who /which, qui dépendent eux aussi de mots particuliers appa
 raissant     à un autre endroit du texte. Sans faire appel à aucune connais
 sance     sur la signification de ces pronoms ou sur leur « référence » aux
 noms qui les précèdent, nous pouvons conclure, d'après leur distribution
 dans le texte, que ce ne sont pas des éléments indépendants : ils contiennent
 une partie (discontinue) de l'occurrence du morphème auquel ils sont
 correliés.
         On rencontre un autre type d'occurrence liée dans des expressions
 réciproques comme each other et together qui introduisent dans la langue
 certaines des fonctions remplies par les variables dans les expressions
mathématiques — mais avec ce manque de netteté et cette complexité
qui sont caractéristiques de la langue. La phrase Foster and Lorch saw
each other at the same moment est normale; mais enlevez and Lorch, et
tous les anglophones remplaceront immédiatement each other par autre
chose. Autrement dit, nous ne trouvons pas de phrase qui contienne each
other sans contenir soit l'expression and Z, soit un morphème de pluriel
dans le nom correspondant. Et aussi bien nous trouverons la phrase
Electrons and positrons attract each other, mais nous ne trouverons pas
— dans un livre de physique tout au moins — la même phrase avec
omission de and positrons, sauf s'il y a aussi d'autres modifications telles
que le remplacement de attract par repel.
        On peut remarquer que les éléments dépendants ont particulièrement
tendance à appartenir, dans leurs différentes occurrences, à des classes
d'équivalence différentes, puisque chaque occurrence appartient à la classe
de l'élément, quel qu'il soit, qui lui est correlié. Si le texte disait : You
will prefer X-, You will prefer it, The survey showed, It showed, la première
occurrence de it appartiendrait à la classe de X-, la seconde à la classe
de survey.
        Dans tous ces cas, on peut éliminer les rapports spéciaux d'occur
rence     liée entre des éléments particuliers, en faisant simplement de l'él
ément dépendant une partie de l'élément auquel il est correlié (dont son
occurrence dépend). Il est bien entendu que, quand nous parlons de
dépendance, l'application que nous en faisons est restreinte au texte
particulier considéré. Il se peut que l'interdépendance entre les pronoms,
ou les mots réciproques, et un quelconque nom voisin se maintienne dans
tous les textes où ces mots apparaissent; mais l'interdépendance entre
les deux occurrences de they ou de you dans notre texte est spécifique
à ce texte; on pourrait trouver ailleurs la phrase they prefer X- to any
hair tonic you've used; mais dans ce texte particulier, nous n'avons pas
cette phrase. C'est pourquoi dans ce texte nous pouvons dire ce que le
second pronom doit être, en considérant le premier.

    7.2. Subdivisions des phrases.
         La présence d'éléments dépendants nous conduit à considérer diff
éremment      la subdivision des phrases.
28

         Quand les parties dépendantes d'un élément sont dispersées sur
  toute une zone, nous devons généralement considérer toute cette zone
  comme constituant un seul fragment comportant cet élément. Dans
  they prefer X- to any hair tonic they've used par exemple, nous avons mont
  ré    que les deux occurrences de they sont interdépendantes dans ce texte;
  nous pouvons donc décomposer cet énoncé en they (se présentant dans les
  deux positions) plus... prefer X- to any hair tonic... 've used; de même
  pour la phrase avec you (également dans les deux positions). Il s'agit là
  d'un traitement plus général que celui du paragraphe 7.1., qui donnait
  un statut privilégié à la première occurrence de they et de you en en fai
  sant dépendre la seconde occurrence, et qui fondait l'identité des deux
 phrases dans leur dernière partie sur le fait que toutes deux renfermaient
 le même type de dépendance (Q). Ce nouveau traitement élimine la
 dépendance en considérant que l'unique they ou you figure dans les deux
 positions, et établit sans conditions l'identité des secondes parties des
 phrases. Le résultat de ce nouveau traitement est que, puisque le they
 à double position s'étend sur presque toute la longueur de la seconde
 partie, toute cette seconde partie doit être enfermée dans le même frag
 ment que they. L'unification des deux occurrences de they nous empêche
 donc de faire là deux segments; sinon nous aurions pu avoir deux seg
ments      : they prefer... et soit they've used soit Q've used.
         D'un autre côté, il y a des cas où la dépendance nous conduit à dis
tinguer      plus de segments que nous ne le ferions autrement. Prenons par
exemple la phrase Casals, who is self-exiled from Spain, stopped performing
after the fascist victory. Si nous étudions le texte dans lequel est enchâssé
cet énoncé, nous trouvons que le who est dépendant de Casais, tout comme
le second they est dépendant du premier : le texte contient And the same
Casals who... mais plus loin The records which... Nous pouvons donc dire
que le who « contient » Casals, c'est-à-dire qu'il en est soit la continuation,
soit la répétition. Mais laquelle des deux est-il? S'il en est la continuation,
nous n'avons qu'un segment, la première partie (C) étant Casals who,
la seconde (S) étant is self exiled... stopped... S'il en est la répétition, nous
avons deux segments, l'un enchâssé dans l'autre : le premier est constitué
de Casais (C de nouveau), plus stopped performing (Sx), le second de who
(considéré comme équivalent de Casals) plus is self-exiled (S2). Nous
n'opterions pour la seconde solution que si nous pouvions montrer, en
fonction du texte, que is self-exited... et stopped performing... sont deux
éléments distincts (et non simplement deux parties d'un même long él
ément)     — si, par exemple, nous trouvions dans le texte deux autres
phrases : The press failed to say why he stopped performing, etc. But he
has stated publicly why he is self-exiled, etc. Dans tous les cas, who contient
Casals. Mais si la phrase originelle est Casals who S, notre analyse donne
CS, tandis que si (à la lumière des deux dernières phrases) nous considé
ronsphrase originelle comme étant Casals who S2SV notre analyse donne
        la
CC S2 Sv et divise la phrase en deux segments CS2 et CSj, le résultat
29

étant que S2 et Sx sont équivalents puisqu'ils apparaissent tous deux
après C. La seule différence qu'il y a entre le fait déconsidérer un élément
dépendant comme une continuation et le fait de le considérer comme
une répétition réside dans le nombre de segments — un ou deux — en
lequel nous pouvons alors décomposer le tout.
      Nous venons de voir que, quand une phrase contient un élément A,
qui est dépendant de B, nous pouvons soit considérer toute la phrase
comme un seul segment dans lequel A est simplement une continuation
de B, soit la considérer comme deux segments, l'un contenant B et l'autre
contenant A dans la même classe que B. En règle générale, on optera
plutôt pour cette seconde solution si le reste de la phrase peut se diviser
en deux parties comparables, l'une allant avec A et l'autre avec B.
      Des choix de ce type peuvent se présenter même là où il n'y a pas
de formes dépendantes. Par exemple, dans notre second texte, nous
avons ensuite la phrase The self-exiled Casals is waiting across the Pyrenees
for the fall of Franco; nous souhaitons mettre self-exiled dans la même
classe que is self-exiled..., puisqu'ils comportent les mêmes morphèmes
(à condition de pouvoir montrer d'après le texte lui-même que self-exiled
est équivalent à self-exiled from Spain); ceci nous donne la structure de
phrase particulière S2 C S3, par comparaison avec les phrases CS précé
dentes. Si maintenant par un heureux hasard le texte contenait également
la phrase Casals is waiting across the Pyrenees for the fall of Franco (ce
qui est trop demander en fait de répétition), nous serions à même de faire
l'analyse suivante : nous avons comme phrases du texte : CS1} C is S2,
S2CS3, CS3; les séquences S1} S2 et S3 sont toutes membres d'une même
classe d'équivalence S, puisqu'elles apparaissent toutes après C. La diff
iculté vient de cet étrange objet qu'est S2CS3. Disons maintenant que
toute phrase XjAX2 peut être « transformée » en A is Xj : AX2 12; ceci
signifie que, si XjAXg se trouve dans le texte, alors A is Xx : AX3 s'y
trouve aussi; dans ce cas, nous considérons XXAX2 comme équivalent à
A is Xx : AX2. Notre étrange objet S2CS3 disparaît alors : nous le rempla
çons C is S2 et CS3, qui tous deux se retrouvent ailleurs dans le même texte.
       par
       On peut continuer dans cette voie jusqu'à des transformations qui ne
sont pas déjà justifiées par le texte, pourvu qu'elles ne soient pas en contra
diction avec lui. Par exemple, nous trouvons dans le texte les phrases
The memorable concerts were recorded in Pardes... The concerts were recor
dedfirst on tape. Nous pouvons écrire ceci MNRX : NR2 (l'équivalence de
Rx et R2 est supposée démontrée à un autre endroit du texte), et nous
transformerions la première phrase en N is M : NRr Nous ne prétendons
 pas par là que notre transformation N is M (The concerts were memorable)
figure vraiment dans le texte, ou qu'il n'y ait pas de différence stylistique
ou autre entre The memorable concerts were recorded in Prades et The

     12. Dans les formules comme A is Xt : AX2, le : indique la fin d'une phrase ou
d'un segment. (On l'utilise de préférence au point qui risquerait d'être confondu avec
le point marquant les fins de phrase dans le texte de l'auteur.)
30

concerts were memorable : The concerts (ou They) were recorded in Prades.
Tout ce que cette transformation signifie, c'est qu'on considère MNRj^
comme équivalent de N is M : NRj, parce qu'on trouve bien S2GS3
comme équivalent de C is S2 : CS3, en ce sens que tous deux figurent
dans le texte modifié.
         D'une part nous avons éliminé de notre agencement en tableau la
structure de segment spéciale MNRX ou S2CS3 — spéciale parce que
les autres segments sont tous de la forme NR ou CS. D'autre part, nous
avons découvert que M (ou plutôt is M) est membre de la classe R. Mais
surtout nous avons établi qu'une phrase peut être représentée par deux
segments même si elle ne contient pas deux ensembles des classes d'équi
valence voulues. C'est ce qui arrive quand nous pouvons démontrer
qu'une seule classe dans la phrase a ailleurs un rapport indépendant avec
deux autres classes ou éléments. Cette classe est donc répétée une fois
dans chaque segment; et chaque segment marque individuellement le
rapport de cette classe avec l'une des deux autres 13.
         Ces difficultés dans la division en segments viennent des rapports
que les classes d'équivalence entretiennent les unes avec les autres. Une
phrase n'est pas simplement l'occurrence simultanée de différents mor
phèmes       ou séquences; ceux-ci sont généralement liés, les uns aux autres,
par un rapport spécifique, qui peut s'exprimer par un ou plusieurs mor
phèmes       d'ordre : You wrote Paul et Paul wrote you ne diffèrent que par
l'ordre des morphèmes. Si nous trouvons dans notre texte plusieurs seg
ments      de la forme CS, cela signifie que C est dans un rapport particulier
avec S — celui de se présenter avec S, et devant lui. Puisque nous n'opé
ronspas sur le sens, nous ne savons pas ce que c'est que ce rapport, mais
nous prenons soin de représenter le même ordre de morphèmes dans la
phrase par le même ordre de classes dans le segment. Quand maintenant
nous trouvons S2CS3, nous ne savons pas quel est le rapport entre cet
ordre et l'ordre CS, et nous ne pouvons faire aucune comparaison entre
les deux phrases. Il faut donc réorganiser ce S2CS3 inconnu, pour qu'il
contienne les mêmes classes dans le même ordre que d'autres segments
— et, bien entendu, nous devons montrer que la forme remaniée est équi
valente,      pour ce texte, à la forme originale. Dans la plupart des cas, la
seule façon d'y arriver est de diviser la phrase inconnue, au moyen de
transformations comme celles que nous avons vues plus haut, en deux ou
plusieurs segments, de façon à ce que les segments obtenus aient une forme
qui se rencontre dans le texte.
         De cette manière, nous obtenons un grand nombre de segments de
structure semblable, même dans un texte dont les phrases sont très
différentes les unes des autres.

    13. Nous avons considéré ici le cas important de la séquence adjectif + nom
+ verbe, dans laquelle le nom a des rapports indépendants avec l'adjectif et avec le
verbe. On peut représenter l'adjectif, aussi bien que le verbe, comme prédicat du nom.
Nous reviendrons sur cette question au paragraphe 7.3.
31


    7.3. Transformations grammaticales.
       Nous avons vu jusqu'ici comment on peut étudier la structure d'un
texte sans faire appel à aucune information qui ne soit pas fournie par le
texte lui-même : la procédure directe consiste à dresser des classes d'équi
valence et à découvrir des schemes de combinaison de ces classes dans
les segments successifs du texte (c'est-à-dire à trouver des combinaisons
semblables ou partiellement semblables). On obtient souvent cependant
beaucoup de petites classes et de segments qui ne sont pas semblables,
parce que les phrases sont si différentes les unes des autres; quand c'est
le cas, on s'aperçoit qu'en comparant les phrases du texte on peut parfois
montrer qu'une partie d'une phrase est équivalente (pour ce texte) à
une partie différente d'une autre phrase et, par conséquent, qu'elle contient
les mêmes classes. Ceci dépend du nombre de répétitions que contient le
texte.
       Passons maintenant à la possibilité de pousser plus loin dans la
même direction en faisant appel à une information extérieure au texte;
celle-ci sera de la même nature que celle que nous avons cherché à établir
à l'intérieur du texte, c'est-à-dire qu'elle conservera l'équivalence de
parties de phrases (au sens où MNR est équivalent à N is M : NR); elle
reviendra à la même opération fondamentale, c'est-à-dire à la comparaison
de phrases différentes. Et elle tendra au même but : montrer que deux
phrases, différentes par ailleurs, contiennent la même combinaison de
classes d'équivalence, même si elles contiennent des combinaisons diff
érentes de morphèmes. La seule nouveauté, c'est qu'au lieu de comparer
deux phrases du texte, nous comparerons une phrase du texte à des
phrases qui ne sont pas dans le texte.
       On pourrait penser qu'il s'agit là d'une différence capitale et s'inter
rogersur la validité de l'application à notre texte d'une équivalence ainsi
 établie. Nous avons déjà répondu à cette objection au paragraphe 3 : si
nous pouvons montrer que deux séquences sont équivalentes dans toutes
les phrases anglaises où elles figurent, alors elles sont équivalentes dans
tout texte écrit en anglais. Si dans toute phrase anglaise contenant XAY,
le XAY est équivalent à A is X : AY, alors si nous trouvons S2CS3 dans
notre texte anglais nous pouvons dire que S2CS3 équivalent à C is S2 : CS3.
       Mais qu'est-ce que Y équivalence? Deux éléments sont équivalents
 s'ils se trouvent dans le même environnement à l'intérieur de la phrase.
Deux phrases d'un texte sont équivalentes simplement si elles se trouvent
 toutes deux dans ce texte (sauf si on découvre des détails de structure
 assez fins pour montrer que deux phrases ne sont équivalentes que si elles
 figurent dans des positions structurelles semblables dans ce texte). De
 même, deux phrases d'une langue sont équivalentes si elles se rencontrent
 toutes deux dans cette langue. En particulier, on dira que des phrases de
 la forme A sont équivalentes à des phrases de la forme B si, pour chaque
 phrase A, on peut trouver une phrase B contenant les mêmes morphèmes,
32

   mises à part les différences dues à la différence de forme entre A et B :
   par exemple, I^VNa est équivalent à N2 is V-en by Nx parce que pour
  toute phrase comme Casals pldys the cello, on peut trouver une phrase
   The cello is played by Casals.
         Nous ne soutenons nullement que deux phrases équivalentes signi
  fient nécessairement la même chose, ni qu'elles soient pareilles du point
  de vue stylistique. Mais par contre nous soutenons que toutes les phrases
  ne sont pas ainsi équivalentes : la relation d'équivalence n'est pas sans
  intérêt, comme elle le serait si elle existait pour toutes les phrases. Par
  exemple, NjVN,} n'est pas équivalent à Nx is V-en by N2, parce que cette
  dernière forme se trouve pour certains N± et certains N2 (I saw you et
  / was seen by you), mais pas pour tout Nj^ et tout N2 (on ne trouve pas
  Casals is played by the cello) u. Nous affirmons de plus que l'application
  de cette équivalence grammaticale provenant de l'extérieur nous per
 mettra     de découvrir dans notre texte des segments semblables supplément
 aires nous ne pourrions pas trouver par la simple comparaison des
          que
 phrases du texte. Ainsi, on peut démontrer que dans divers environne
 ments he, etc., sont grammaticalement équivalents aux noms qui les
           who,
 précèdent, et que Nx who Vx V2 est équivalent à NjVg : N^; dans Casais,
 who is self-exiled... stopped performing..., il y a deux segments CSX : G
 is S2; nous aboutirions à ce résultat (sans avoir à nous préoccuper de
 savoir si Casals who constitue une occurrence prolongée de C, ou deux
 occurrences répétées), même s'il n'y avait pas d'autre occurrence de who
 dans le texte, c'est-à-dire même si l'analyse était impossible à partir du
 seul texte. L'équivalence grammaticale nous est particulièrement utile si
 nous avons par exemple un grand nombre de segments contenant tous
 Casais, entremêlés avec beaucoup d'autres contenant he, et si nous ne
 pouvons trouver aucun environnement contextuel commun pour démont
 rer     que Casais et he sont équivalents. Dès que nous acceptons cette
 équivalence grammaticale, nous pouvons montrer que tous les environne
ments Casais sont équivalents à ceux de he; et ceci peut à son tour
           de
 nous permettre de découvrir d'autres équivalences à partir du texte.
         On peut explorer plus systématiquement l'équivalence grammaticale
en introduisant une technique de variation expérimentale. Supposons
que nous ayons une phrase d'une forme donnée A et que nous voulions
une forme B; nous essayons de modifier A, le changement consistant un
iquement      en la différence formelle qui existe entre A et B, pour voir
ce qui se passe alors en A. Supposons par exemple que nous ayons The
memorable concerts were recorded... qui est de la forme MNR, et que nous
voulions rendre la forme de cette phrase comparable à celle de segments
précédents commençant par N; à cette fin, nous cherchons une variante

        14. Il est vrai qu'on pourrait soutenir que cette dernière phrase est encore gramm
aticale.    Mais la grammaire actuelle ne fait pas de distinctions entre les divers membres
d'une classe morphologique. Par conséquent, l'exigence que la phrase B contienne les
mêmes morphèmes que la phrase A sort de la grammaire, au sens courant de ce terme.
33

de cette phrase qui commence par The concerts; on peut essayer de
l'obtenir en plaçant un informateur dans une situation sociale authen
tique     productrice de parole (et non un exposé linguistique sur la parole),
dans laquelle il énoncerait une phrase commençant par The concerts et
contenant les mots memorable et recorded 15. Ou bien on peut y arriver
par le travail fastidieux de l'observation, en cherchant une phrase qui
commence par The concerts et contienne memorable et recorded. Par l'une
ou l'autre de ces deux méthodes, nous pourrions obtenir The concerts
were memorable and were recorded, ou quelque chose d'approchant 16,
qui montrerait que quand M (ou tout autre adjectif) passe de l'autre côté
de N (le nom qui le suit), on insère is; MN est équivalent à N is M. Nous
découvrons ainsi que, quand MNR passe à une forme qui commence
par N, un is apparaît entre N et le M qui le suit.
        Cette technique consistant à faire varier la forme grammaticale
d'une phrase, tout en gardant constants ses morphèmes ne peut pas s'ap
pliquer     à l'intérieur d'un texte; car là, tout ce que nous pouvons faire,
c'est étudier le matériau qui nous est donné. Mais on peut l'utiliser pour
la langue, hors du texte, car nous avons le droit, en tant que locuteurs,
de créer une situation sociale qui pourrait amener un autre locuteur à
prononcer telle phrase plutôt que telle autre parmi toutes les phrases dont
il dispose. Cette technique est particulièrement utile avec une langue
 comme l'anglais, où tant de morphèmes figurent dans diverses classes
grammaticales.
         Le paragraphe précédent montre la précaution essentielle que nous
 devons prendre quand nous appliquons l'équivalence grammaticale pour
 étoffer les classes d'équivalence contextuelle : nous ne nous posons pas
 simplement la question : Quelles formes de phrase sont équivalentes à
MNR? Il peut y en avoir beaucoup. La question que nous nous posons est :
 Puisque N... est une forme commune dans ce texte, et puisque nous y
 trouvons aussi MNR, peut-on remplacer cette dernière forme par une
 phrase équivalente de la forme N...? Le sens du changement à opérer
 n'est pas arbitraire mais vient entièrement du texte. Comme précédem
 ment, revient à diviser les phrases en des segments aussi semblables
           cela
 que possible. Tout ce que nous nous demandons, c'est s'il existe une équi
 valence     grammaticale qui relie MNR à la forme N...; la réponse est oui,
 pourvu qu'un is figure dans la forme N...; ce qui à son tour fait de is M

    15. Pour donner un exemple très simple, on peut lire en compagnie de l'informateur la
phrase du texte The memorable concerts were recorded, puis s'arrêter et lui dire de façon
hésitante et interrogative « That is to say, the concerts » (c'est-à-dire, les concerts...)
et attendre qu'il donne la suite.
     16. Nous pouvons trouver beaucoup de phrases qui commencent par The concerts
et qui contiennent les deux autres mots, par exemple The concerts were not memorable,
but were neverthless recorded. Ces phrases contiendront divers mots en plus de ceux de la
phrase originelle; mais le seul mot nouveau qui se trouvera dans toutes les phrases de la
forme voulue NMR (ou plutôt dans une sous-classe des phrases NMR) sera une forme
du verbe to be. C'est donc le seul mot nouveau qui soit indispensable quand on opère
le changement pour obtenir cette forme.
34

 un équivalent de R. Comme ailleurs en linguistique, il ne s'agit pas de
 donner à toutes les phrases n'importe quelle forme choisie arbitrair
 ement; méthode permet simplement de décrire les formes moins
         la
 fréquentes du texte (MNR) en fonction des formes fréquentes (N...).
     Pour l'analyse purement contextuelle, nous n'avons besoin de connaître
 que les limites des morphèmes. Pour utiliser les équivalences grammatic
 ales, devons également connaître la classe morphophonologique à
        nous
laquelle chaque morphème de notre texte appartient, puisque les règles
grammaticales concernent des classes plutôt que des morphèmes indivi
 duels. Dans le cas considéré, la règle grammaticale est : adjectif + noin
est équivalent à nom + is + adjectif; pour pouvoir l'appliquer à notre
séquence MN, nous devons savoir que le M est un adjectif et que le N
est un nom.
     On a constaté empiriquement que le nombre d'équivalences grammat
icales  auxquelles on fait appel à chaque fois pour réduire des phrases
d'un texte en des segments semblables, est relativement peu élevé. C'est
pourquoi, même si on n'est pas linguiste, on peut apprendre beaucoup
sur le texte en utilisant (en plus de la méthode d'analyse interne du texte)
une liste préétablie des principales équivalences grammaticales pour la
langue en question. Voici quelques-unes des équivalences qui sont fréquem
ment   utilisées (nous ne donnons aucune preuve de leur validité, et seul
ement quelques indications très approximatives des environnements de
phrase où elles s'appliquent) 17.

     1) Si nous trouvons XCY, alors X = Y (X est équivalent à Y). Le
C est une conjonction comme and, but, or, ou bien, dans certaines circons
tances spéciales, un syntagme comme as well as, rather than, A-er than.
X et Y doivent être dans la même classe grammaticale. Par exemple, dans
I phoned him but he was out, X et Y sont tous deux de la forme NV; dans
I saw it but went on, Y est seulement constitué par le syntagme verbal
went on, X ne peut donc inclure que le syntagme verbal saw it (et non
toute la séquence I saw if). Il s'ensuit que N^CN^ est équivalent à
deux segments N^ : N2V2 et NV^V-j = NVX : NV2.

    2) La séquence Nx is N2 indique que Nj_ = N2. La classe de is comprend
remains et d'autres verbes.

    3) Nj N2, avec un accent primaire sur chaque N, indique que Nx = N2;
exemple : The pressure P increases est équivalent à The pressure increases
et P increases.

    4) NV (that) NV = NV : NV; exemple / telegraphed that we'll arrive
to-morrow est équivalent à I telegraphed : we'll arrive to-morrow.


   17. A = adjectif. N = nom, V = verbe, P = préposition. Les indices indiquent des
morphèmes particuliers, sans tenir compte de leurs classes.
35

     5) NjVK^ = NgV*^, V et V* étant respectivement actif et passif ou
vice versa.
      6) NjPNa = NaP*^; exemple : (they seek) the goal of certainty
est équivalent à une certaine forme comme (they seek) certainty as a goat.
Quand on inverse deux noms la modification des prépositions est bien plus
grande que la modification correspondante des verbes : dans le cas des
verbes, elle s'effectue simplement par l'addition ou le retrait du morphème
de passif et du mot by; dans le cas des prépositions, il faut remplacer une
forme par une forme entièrement différente. Les paires de prépositions
équivalentes ne sont pas fixes : entre certains noms, le substitut de of
peut être as; entre d'autres noms, il peut être with. Néanmoins il est pos
sible de trouver des structures dans lesquelles les noms de la séquence
N2 P N2 sont inversés.

    7) Nj P N2 = Ag N1$ autrement dit, le morphème du second nom appar
aîtsous une forme adjectivale avant le premier nom; exemple : training
in médecine et medical training.
     8) Des pronoms comme he, et certains mots commençant par wh-
et th-, répètent un nom déjà énoncé. Quand ils sont précédés de plusieurs
noms, quel nom répètent-ils? Cela dépend des détails de l'environnement
grammatical; c'est généralement le nom qui les précède immédiatement,
ou le dernier nom figurant dans un environnement grammatical comparable.
Par exemple, who = the man dans The man who phoned left no name
(N who Vx V2 = NV2 : NVj); who = my roommate dans The man spoke to
my roommate, who told him to call again (N^Ng who V2 = N^Ng :
N2 V2). Il y a de nombreux procédés pour déterminer quel est le nom qu'un
pronom répète, et quel verbe va avec chaque nom. Dans the man who
phoned, on ne peut pas insérer un sujet avant phoned, il faut donc prendre
who comme sujet. Dans The man I phoned was out, nous réduisons d'abord
en / phoned : The man was out; ensuite, puisqu'on ne peut pas insérer un
complément d'objet après phoned dans la phrase originelle, nous faisons
de the man le complément d'objet 18 de phoned et nous obtenons l'équiva
lentphoned the man : The man was out (
      : /

     9) NV15 V2-ing = NVj_ : NV2; exemple : They escaped, saving nothing
est équivalent à They escaped : They saved nothing.
     10) NiClNLj VX = IS^VM, : NgVNj. Ici X représente une classe
d'expressions réciproques comme each other; par exemple : The Giants
and the Dodgers each beat the other twice est équivalent à The Giants beat
the Dodgers twice : The D. beat the G. twice. L'équivalence est quelque peu
différente pour les différents groupes de formes X.

     18. La seule façon d'exprimer l'exclusion d'un complément d'objet uniquement en
fonction de l'occurrence des éléments est de dire que l'objet figure déjà. Ce ne peut être
I puisque / est le sujet de phoned, ce doit donc être l'autre N, the man.
36

       11) ANV = N is A : NV, cf. l'exemple the self-exiled Casals... du para
graphe     7.2. De même NVANj = NVNj who is A = NVNX : Nt is A;
exemple : They read the interdicted books = They read the books which were
interdicted — They read the books : The bocks were interdicted.

        12) NjVKjPNg = NjVNa : N^VPNg; c'est-à-dire qu'on peut remplac
er double complément d'objet par deux compléments d'objet dis
       un
tincts    dans deux segments qui répètent le sujet et le verbe; exemple :
/ bought it for you = I bought it : I bought for you.

      Ces équivalences grammaticales conservent les morphèmes et leurs
rapports grammaticaux, mais sous une autre forme grammaticale. On
ne peut avoir NjVNa = NgVNj, parce que cela modifierait le rapport
sujet-objet avec le verbe; mais on peut avoir N2V*NX comme équivalent
de NjVNa parce que là le verbe aussi est modifié de façon à ce que soit
préservé son rapport grammatical avec les noms inversés. II est absolu
mentessentiel de préserver les rapports grammaticaux, car ces rapports
existent toujours entre les morphèmes d'une phrase. Autrement dit, il y a
des restrictions de commutabilité d'ordre et d'intonation entre les diffé
rents morphèmes (ou classes de morphèmes) d'une phrase et, quand nous
passons d'une phrase à une phrase équivalente, nous voulons pouvoir
retrouver les mêmes restrictions quand nous reviendrons à la phrase de
base — puisque cette phrase de base, comme toute phrase, se définit par les
restrictions qui lient ses différentes parties. Par conséquent, quand nous
divisons une phrase en différents segments pour dresser un tableau, nous
ne voulons pas que deux combinaisons des mêmes classes d'équivalence
(par exemple les deux premières combinaisons TE ci-dessus) représentent
des rapports grammaticaux différents. C'est pourquoi, quand nous trans
formons    une phrase qui contient certaines classes d'équivalence, nous
prenons soin de conserver leurs rapports grammaticaux originels.
      Cependant, nous trouvons quelquefois des morceaux de phrase qui
ne contiennent aucune de nos classes d'équivalence; autrement dit (dans
le cas le plus simple), ils ne contiennent aucun matériau qui se retrouve
ailleurs dans le texte. Le rapport grammatical entre les morceaux uniques
et le reste de la phrase doit être conservé dans notre disposition en tableau,
au même titre que celui des morceaux récurrents. Mais nous n'avons pas
à nous préoccuper de conserver leur rapport quand leur position relative
change, puisque nous n'avons pas de raison de changer leur position
relative : c'est seulement les classes d'équivalences que nous voulons
redisposer. Pour ce matériau non récurrent, nous voulons seulement
connaître son rapport aux classes d'équivalence et indiquer ce rap
port dans l'analyse. L'étude du texte seul ne suffira peut-être pas, mais
nous pouvons y arriver en faisant appel aux données grammaticales ou
à la variation expérimentale. Revenons par exemple aux séquences Casais,
who is self-exiled from Spain et the self -exiled Casals... Si cette dernière
 orme est S2 C, la première est C, C is S2 from Spain; puisque from Spain
37

est unique, tout ce que nous voulons savoir, c'est où le mettre quand nous
disposons nos classes d'équivalence, autrement dit, quel est son rapport
à ces classes. La grammaire nous apprend que dans des phrases de la forme
NV APN l'unité minimale, dont PN est un constituant immédiat, est APN
et que ce APN peut être remplacé par A tout seul 19. Par conséquent, si le
A se trouve être membre d'une de nos classes d'équivalence alors que le
PN ne l'est pas, nous associons le PN à A dans sa colonne d'équivalence
en écrivant APN au lieu de A tout seul comme membre de la classe.
       De façon plus générale, le matériau qui n'appartient à aucune classe
d'équivalence, mais qui est lié grammaticalement à un membre d'une classe,
est joint à ce membre pour former un membre élargi de la classe en ques
tion; ainsi self-exiled from Spain est maintenant dans la même classe que
seïf-exiled. Ceci se justifie par le fait que, puisque ce matériau ne se retrouve
nulle part ailleurs dans le texte (ou ne s'y retrouve que dans le même rap
port grammatical à la même classe d'équivalence), son seul effet, quand on
représente le texte par ses classes d'équivalence spécifiques, est précis
ément     son rapport au membre spécifique auquel il est grammaticalement lié.
        On rencontre un cas particulier assez intéressant quand deux membres
de la même classe d'équivalence constituent conjointement l'unité immé
diatement       supérieure de leur phrase (c'est-à-dire quand ils sont les consti
tuants immédiats de cette unité), quand, par exemple, ces deux membres
sont un adjectif suivi d'un nom, avec AN = N. Dans ce cas, nous pouvons
considérer que ces membres constituent à eux deux un seul membre de
leur classe commune et entrent tous deux dans un seul segment. Si nous
les considérions comme deux occurrences de leur classe commune, il nous
faudrait mettre chaque occurrence dans un segment distinct.
       Les données grammaticales sont particulièrement utiles quand il
s'agit de reconnaître les particules conjonctives. Il est facile d'identifier
ces morphèmes à partir de la grammaire formelle, tout à fait indépendam
ment sens, mais il peut être difficile de les identifier dans l'ana
          de leur
lysepurement contextuelle. Leur importance réside dans le fait que beau
coup de phrases d'un texte peuvent contenir les mêmes classes, à part
quelques mots non classés, souvent situés au début, dont la fonction gram
maticale      est de lier ou d'introduire les phrases, et qui n'entrent pas dans
les classes spécifiques qui couvrent la phrase ou le segment. Dans notre
disposition en tableau, nous mettrons ces éléments, en raison de leur posi
tion grammaticale, dans une colonne spéciale au début. Nous pouvons
même aller plus loin et mettre dans cette première colonne tout matériau
qu'on ne peut faire entrer dans aucune des colonnes d'équivalence. Ce
matériau conjonctif n'est pas toujours immédiatement évident; remar
quons qu'on peut analyser beaucoup de phrases de la forme JVV that
N1V1 comme constituées des classes d'équivalence N^, le NV that étant
relégué dans la première colonne; par exemple dans la phrase We are proud

    19. Sémantiquement, on dira que PN « modifie » le A.
38

 that these concerts were recorded by our engineers, les membres connus des
 classes d'équivalence sont concerts et recorded; les mots qui les précèdent
 ne se retrouvent pas dans le texte et ne sont liés grammaticalement à aucun
 membre d'une classe; bien au contraire, du point de vue grammatical
 on peut les remplacer par des adverbes introductifs comme indeed, même si
 au sens purement grammatical ils sont en fait le sujet et le verbe princ
 ipaux de la phrase.
         En plus des rapports grammaticaux des classes grammaticales tout
 entières, on peut utiliser des informations concernant le rapport entre
 des morphèmes spécifiques ou des sous-classes grammaticales et les classes
 grammaticales; on peut par exemple établir que (dans certaines langues)
 les verbes intransitifs forment une sous-classe qui ne se trouve jamais
 accompagnée d'un objet et qui est équivalente à un verbe transitif accom
 pagné d'un objet. Dans un texte donné, cela peut nous permettre de mettre
 un verbe transitif et son objet dans la même classe qu'un verbe intransitif
 ayant une position comparable.
         Enfin un grand nombre d'équivalences détaillées s'appliquent à des
 morphèmes spécifiques. Les renseignements concernant ces équivalences
ne nous sont pas fournis par la linguistique descriptive, qui traite géné
ralement      de classes entières, mais on peut les obtenir par des méthodes
linguistiques puisqu'ils concernent des occurrences couplées et des restric
tions     spéciales — bien que dans la plupart des cas il soit nécessaire d'étu
dier    ces restrictions en considérant plus d'une phrase à la fois. Supposons,
par exemple, que nous trouvions les mots buy et sell dans un texte. Leurs
environnsments dans ce texte peuvent ne pas se ressembler assez pour nous
permettre de les ranger dans la même classe d'équivalence, en dépit des
avantages que cela pourrait avoir pour l'analyse. Mais si nous examinons
un certain nombre d'autres textes assez courts où ces deux mots figurent,
nous constaterons qu'ils apparaissent souvent dans des environnements qui
se correspondent et que, à certains égards, ce sont des inverses distribu-
tionnels; autrement dit, nous trouvons de nombreuses phrases comme
N-t buys from N2 : N2 sells to Nt (I bought it from him at the best price I could
get, but he still sold it to me with a profit). Si les environnements de buy et
sell dans notre texte sont semblables aux environnements couplés des
autres textes, nous pourrons quand même, en considération de ces résul
tatsplus généraux, mettre les deux mots dans la même classe d'équival
ence, même les analyser comme étant inverses l'un de l'autre.
           ou
       De cette façon on peut mettre dans une même classe contextuelle
plus de mots qu'il ne serait possible autrement, et on peut faire usage de
ce qui paraît être des liaisons sémantiques spéciales entre des mots (comme
entre buy et sell ou même entre un verbe transitif et la présence d'un
complément d'objet), sans sortir du cadre d'une étude purement formelle
des occurrences. La raison en est qu'il y a un haut degré de corrélation
entre les différences de sens et les différences de distribution linguistique;
et si, dans les limites d'un texte, on ne peut pas montrer les similitudes
Analyse du discours
Analyse du discours
Analyse du discours
Analyse du discours
Analyse du discours
Analyse du discours
Analyse du discours

Weitere ähnliche Inhalte

Was ist angesagt?

Intégration pédagogique des TIC
Intégration pédagogique des TICIntégration pédagogique des TIC
Intégration pédagogique des TICHanane Eljarroudi
 
Développer ses soft skills : un essentiel dans une société interconnectée
Développer ses soft skills : un essentiel dans une société interconnectéeDévelopper ses soft skills : un essentiel dans une société interconnectée
Développer ses soft skills : un essentiel dans une société interconnectéePMI-Montréal
 
Les Ressources Audiovisuelles dans l´Education
Les Ressources Audiovisuelles dans l´EducationLes Ressources Audiovisuelles dans l´Education
Les Ressources Audiovisuelles dans l´EducationDaniane Bornea Friedl
 
Comment batir une équipe de travail performante
Comment batir une équipe de travail performanteComment batir une équipe de travail performante
Comment batir une équipe de travail performanteDrake International
 
Objectifs pédagogiques, La Taxonomie de Bloom revisitée
Objectifs pédagogiques, La Taxonomie de Bloom revisitéeObjectifs pédagogiques, La Taxonomie de Bloom revisitée
Objectifs pédagogiques, La Taxonomie de Bloom revisitéeKhaLid Oualarbi
 
Techniques de communication et prise de parole
Techniques de communication et  prise de paroleTechniques de communication et  prise de parole
Techniques de communication et prise de paroleMihamou Abderrazaq
 
L'Apprentissage Collaboratif
L'Apprentissage CollaboratifL'Apprentissage Collaboratif
L'Apprentissage CollaboratifErradi Mohamed
 
Soutenance de thèse en sciences de l'information
Soutenance de thèse en sciences de l'information Soutenance de thèse en sciences de l'information
Soutenance de thèse en sciences de l'information Elsa Drevon
 
Ingenierie de formation
Ingenierie de formation Ingenierie de formation
Ingenierie de formation safaejoubi
 
Processus d'apprentissage et Processus d'enseignement
Processus d'apprentissage et Processus d'enseignement Processus d'apprentissage et Processus d'enseignement
Processus d'apprentissage et Processus d'enseignement philip61
 
Présentation Mémoire Master de Recherche
Présentation Mémoire Master de RecherchePrésentation Mémoire Master de Recherche
Présentation Mémoire Master de RechercheRouâa Ben Hammouda
 
Introduction à la communication efficace dans le domaine médical (Med-Pat)
Introduction à la communication efficace dans le domaine médical (Med-Pat)Introduction à la communication efficace dans le domaine médical (Med-Pat)
Introduction à la communication efficace dans le domaine médical (Med-Pat)Houda Aznay
 
Support Formation Audit Qualité Interne.pdf
Support Formation Audit Qualité Interne.pdfSupport Formation Audit Qualité Interne.pdf
Support Formation Audit Qualité Interne.pdfamine373064
 
Introduction à la Pédagogie : notions et concepts
Introduction à la Pédagogie : notions et conceptsIntroduction à la Pédagogie : notions et concepts
Introduction à la Pédagogie : notions et conceptsJ-Y Jeannas
 
TCE1-Organisation administrative
TCE1-Organisation administrativeTCE1-Organisation administrative
TCE1-Organisation administrativeAbdelkhalek Kim
 

Was ist angesagt? (20)

Intégration pédagogique des TIC
Intégration pédagogique des TICIntégration pédagogique des TIC
Intégration pédagogique des TIC
 
Développer ses soft skills : un essentiel dans une société interconnectée
Développer ses soft skills : un essentiel dans une société interconnectéeDévelopper ses soft skills : un essentiel dans une société interconnectée
Développer ses soft skills : un essentiel dans une société interconnectée
 
Les Ressources Audiovisuelles dans l´Education
Les Ressources Audiovisuelles dans l´EducationLes Ressources Audiovisuelles dans l´Education
Les Ressources Audiovisuelles dans l´Education
 
Comment batir une équipe de travail performante
Comment batir une équipe de travail performanteComment batir une équipe de travail performante
Comment batir une équipe de travail performante
 
Procédure de formation
Procédure de formationProcédure de formation
Procédure de formation
 
Le travail en equipe
Le travail en equipeLe travail en equipe
Le travail en equipe
 
Objectifs pédagogiques, La Taxonomie de Bloom revisitée
Objectifs pédagogiques, La Taxonomie de Bloom revisitéeObjectifs pédagogiques, La Taxonomie de Bloom revisitée
Objectifs pédagogiques, La Taxonomie de Bloom revisitée
 
Body language
Body languageBody language
Body language
 
Techniques de communication et prise de parole
Techniques de communication et  prise de paroleTechniques de communication et  prise de parole
Techniques de communication et prise de parole
 
L'Apprentissage Collaboratif
L'Apprentissage CollaboratifL'Apprentissage Collaboratif
L'Apprentissage Collaboratif
 
L'apprentissage
L'apprentissageL'apprentissage
L'apprentissage
 
Soutenance de thèse en sciences de l'information
Soutenance de thèse en sciences de l'information Soutenance de thèse en sciences de l'information
Soutenance de thèse en sciences de l'information
 
Ingenierie de formation
Ingenierie de formation Ingenierie de formation
Ingenierie de formation
 
Processus d'apprentissage et Processus d'enseignement
Processus d'apprentissage et Processus d'enseignement Processus d'apprentissage et Processus d'enseignement
Processus d'apprentissage et Processus d'enseignement
 
gestion des talents.ppt
gestion des talents.pptgestion des talents.ppt
gestion des talents.ppt
 
Présentation Mémoire Master de Recherche
Présentation Mémoire Master de RecherchePrésentation Mémoire Master de Recherche
Présentation Mémoire Master de Recherche
 
Introduction à la communication efficace dans le domaine médical (Med-Pat)
Introduction à la communication efficace dans le domaine médical (Med-Pat)Introduction à la communication efficace dans le domaine médical (Med-Pat)
Introduction à la communication efficace dans le domaine médical (Med-Pat)
 
Support Formation Audit Qualité Interne.pdf
Support Formation Audit Qualité Interne.pdfSupport Formation Audit Qualité Interne.pdf
Support Formation Audit Qualité Interne.pdf
 
Introduction à la Pédagogie : notions et concepts
Introduction à la Pédagogie : notions et conceptsIntroduction à la Pédagogie : notions et concepts
Introduction à la Pédagogie : notions et concepts
 
TCE1-Organisation administrative
TCE1-Organisation administrativeTCE1-Organisation administrative
TCE1-Organisation administrative
 

Andere mochten auch

Recherche qualitative Catherine Jung
Recherche qualitative Catherine JungRecherche qualitative Catherine Jung
Recherche qualitative Catherine JungHubert Maisonneuve
 
Spotter Semo 2009 Atelier Consumer Insight
Spotter Semo 2009 Atelier Consumer InsightSpotter Semo 2009 Atelier Consumer Insight
Spotter Semo 2009 Atelier Consumer InsightActulligence Consulting
 
Divling - Les temps chez Benveniste
Divling - Les temps chez BenvenisteDivling - Les temps chez Benveniste
Divling - Les temps chez Benvenistekimo063
 
Mamaia 2012 présentation
Mamaia 2012 présentationMamaia 2012 présentation
Mamaia 2012 présentationKnitandb b
 
Module02 blanc
Module02 blancModule02 blanc
Module02 blanccbcgreg
 
Atelier de formation au logiciel NVivo : L'analyse thématique du discours
Atelier de formation au logiciel NVivo : L'analyse thématique du discoursAtelier de formation au logiciel NVivo : L'analyse thématique du discours
Atelier de formation au logiciel NVivo : L'analyse thématique du discoursHervé Stecq
 
Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...
Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...
Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...smyrnaios
 
les étapes permettant de poser une question de recherche
les étapes permettant de poser une question de rechercheles étapes permettant de poser une question de recherche
les étapes permettant de poser une question de rechercheHubert Maisonneuve
 
0783 Heiligsprechung ....
0783   Heiligsprechung ....0783   Heiligsprechung ....
0783 Heiligsprechung ....Marianne Zipf
 
8370 Gottes Beschluß ist unabwendbar ....
8370   Gottes Beschluß ist unabwendbar ....8370   Gottes Beschluß ist unabwendbar ....
8370 Gottes Beschluß ist unabwendbar ....Marianne Zipf
 
Cre Presentation 8 10 09 Frpat
Cre Presentation 8 10 09   FrpatCre Presentation 8 10 09   Frpat
Cre Presentation 8 10 09 FrpatFRPAT NORMANDIE
 
iphault presentation
iphault presentationiphault presentation
iphault presentationOrnella Giau
 
0229 Erdenleben zur Förderung .... Leid der geistigen Freunde ....
0229   Erdenleben zur Förderung .... Leid der geistigen Freunde ....0229   Erdenleben zur Förderung .... Leid der geistigen Freunde ....
0229 Erdenleben zur Förderung .... Leid der geistigen Freunde ....Marianne Zipf
 
J'aime je n'aime pas chiara assuntino
J'aime je n'aime pas chiara assuntinoJ'aime je n'aime pas chiara assuntino
J'aime je n'aime pas chiara assuntinoMarina Marino
 

Andere mochten auch (16)

Recherche qualitative Catherine Jung
Recherche qualitative Catherine JungRecherche qualitative Catherine Jung
Recherche qualitative Catherine Jung
 
Spotter Semo 2009 Atelier Consumer Insight
Spotter Semo 2009 Atelier Consumer InsightSpotter Semo 2009 Atelier Consumer Insight
Spotter Semo 2009 Atelier Consumer Insight
 
Divling - Les temps chez Benveniste
Divling - Les temps chez BenvenisteDivling - Les temps chez Benveniste
Divling - Les temps chez Benveniste
 
Mamaia 2012 présentation
Mamaia 2012 présentationMamaia 2012 présentation
Mamaia 2012 présentation
 
Module02 blanc
Module02 blancModule02 blanc
Module02 blanc
 
Atelier de formation au logiciel NVivo : L'analyse thématique du discours
Atelier de formation au logiciel NVivo : L'analyse thématique du discoursAtelier de formation au logiciel NVivo : L'analyse thématique du discours
Atelier de formation au logiciel NVivo : L'analyse thématique du discours
 
Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...
Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...
Une méthode pour articuler analyse des réseaux et des discours sur Twitter La...
 
Chanel N5
Chanel N5Chanel N5
Chanel N5
 
les étapes permettant de poser une question de recherche
les étapes permettant de poser une question de rechercheles étapes permettant de poser une question de recherche
les étapes permettant de poser une question de recherche
 
0783 Heiligsprechung ....
0783   Heiligsprechung ....0783   Heiligsprechung ....
0783 Heiligsprechung ....
 
8370 Gottes Beschluß ist unabwendbar ....
8370   Gottes Beschluß ist unabwendbar ....8370   Gottes Beschluß ist unabwendbar ....
8370 Gottes Beschluß ist unabwendbar ....
 
Cre Presentation 8 10 09 Frpat
Cre Presentation 8 10 09   FrpatCre Presentation 8 10 09   Frpat
Cre Presentation 8 10 09 Frpat
 
PLF MOPA 2009 interpatt
PLF MOPA 2009 interpattPLF MOPA 2009 interpatt
PLF MOPA 2009 interpatt
 
iphault presentation
iphault presentationiphault presentation
iphault presentation
 
0229 Erdenleben zur Förderung .... Leid der geistigen Freunde ....
0229   Erdenleben zur Förderung .... Leid der geistigen Freunde ....0229   Erdenleben zur Förderung .... Leid der geistigen Freunde ....
0229 Erdenleben zur Förderung .... Leid der geistigen Freunde ....
 
J'aime je n'aime pas chiara assuntino
J'aime je n'aime pas chiara assuntinoJ'aime je n'aime pas chiara assuntino
J'aime je n'aime pas chiara assuntino
 

Ähnlich wie Analyse du discours

Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...
Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...
Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...DeAndr Espree-Conaway
 
Article hilaire nov 2007
Article hilaire nov 2007Article hilaire nov 2007
Article hilaire nov 2007blessedkkr
 
Nelly flaux dejan stosic interpréter les temps verbaux
Nelly flaux dejan stosic interpréter les temps verbauxNelly flaux dejan stosic interpréter les temps verbaux
Nelly flaux dejan stosic interpréter les temps verbauxBaudosky Konnigui
 
Resumenes
ResumenesResumenes
ResumenesMA1511
 
Le structuralisme.pptx
Le structuralisme.pptxLe structuralisme.pptx
Le structuralisme.pptxKhalilRebbali
 
Grr6535 erikursus prantsuse keele lingvistikast
Grr6535 erikursus prantsuse keele lingvistikastGrr6535 erikursus prantsuse keele lingvistikast
Grr6535 erikursus prantsuse keele lingvistikastElina Laanes
 
Exposé variation sémantique b.sara et l.zakarya
Exposé variation sémantique b.sara et l.zakaryaExposé variation sémantique b.sara et l.zakarya
Exposé variation sémantique b.sara et l.zakaryaNajlaa Zouaoui
 
Enseigner le vocabulaire
Enseigner le vocabulaireEnseigner le vocabulaire
Enseigner le vocabulaireClaire Doz
 
Conf map Amiens mai 2012 quali/quanti
Conf map Amiens mai 2012 quali/quantiConf map Amiens mai 2012 quali/quanti
Conf map Amiens mai 2012 quali/quantimap8slide
 
F.Chateauraynaud : de Prospero à Marloweb
F.Chateauraynaud : de Prospero à MarlowebF.Chateauraynaud : de Prospero à Marloweb
F.Chateauraynaud : de Prospero à MarlowebOpenEdition
 
strategies pour aprendre suffixes.docx
strategies pour aprendre suffixes.docxstrategies pour aprendre suffixes.docx
strategies pour aprendre suffixes.docxGUILLERMODANIELMONTE
 
Chapitre 3 (1).pptx initiation a la recherche
Chapitre 3 (1).pptx initiation a la rechercheChapitre 3 (1).pptx initiation a la recherche
Chapitre 3 (1).pptx initiation a la rechercheJoseCotes7
 
Les eleves en difficulte d'apprentissage de la lecture – Valdois, S
Les eleves en difficulte d'apprentissage de la lecture – Valdois, SLes eleves en difficulte d'apprentissage de la lecture – Valdois, S
Les eleves en difficulte d'apprentissage de la lecture – Valdois, SDyslexia International
 

Ähnlich wie Analyse du discours (20)

Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...
Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...
Les racines indo-europeenes et la trajectoire semantique du marqueur discursi...
 
Article hilaire nov 2007
Article hilaire nov 2007Article hilaire nov 2007
Article hilaire nov 2007
 
Recherche semantique
Recherche semantique Recherche semantique
Recherche semantique
 
Nelly flaux dejan stosic interpréter les temps verbaux
Nelly flaux dejan stosic interpréter les temps verbauxNelly flaux dejan stosic interpréter les temps verbaux
Nelly flaux dejan stosic interpréter les temps verbaux
 
Presentation1
Presentation1Presentation1
Presentation1
 
1143
11431143
1143
 
Fle et structuralisme
Fle et structuralismeFle et structuralisme
Fle et structuralisme
 
Conférence 1 lex.pptx
Conférence 1 lex.pptxConférence 1 lex.pptx
Conférence 1 lex.pptx
 
Resumenes
ResumenesResumenes
Resumenes
 
La Phrase en Contexte - Actes
La Phrase en Contexte - ActesLa Phrase en Contexte - Actes
La Phrase en Contexte - Actes
 
Le structuralisme.pptx
Le structuralisme.pptxLe structuralisme.pptx
Le structuralisme.pptx
 
Grr6535 erikursus prantsuse keele lingvistikast
Grr6535 erikursus prantsuse keele lingvistikastGrr6535 erikursus prantsuse keele lingvistikast
Grr6535 erikursus prantsuse keele lingvistikast
 
Exposé variation sémantique b.sara et l.zakarya
Exposé variation sémantique b.sara et l.zakaryaExposé variation sémantique b.sara et l.zakarya
Exposé variation sémantique b.sara et l.zakarya
 
Enseigner le vocabulaire
Enseigner le vocabulaireEnseigner le vocabulaire
Enseigner le vocabulaire
 
Conf map Amiens mai 2012 quali/quanti
Conf map Amiens mai 2012 quali/quantiConf map Amiens mai 2012 quali/quanti
Conf map Amiens mai 2012 quali/quanti
 
F.Chateauraynaud : de Prospero à Marloweb
F.Chateauraynaud : de Prospero à MarlowebF.Chateauraynaud : de Prospero à Marloweb
F.Chateauraynaud : de Prospero à Marloweb
 
Intellectica 2005
Intellectica 2005Intellectica 2005
Intellectica 2005
 
strategies pour aprendre suffixes.docx
strategies pour aprendre suffixes.docxstrategies pour aprendre suffixes.docx
strategies pour aprendre suffixes.docx
 
Chapitre 3 (1).pptx initiation a la recherche
Chapitre 3 (1).pptx initiation a la rechercheChapitre 3 (1).pptx initiation a la recherche
Chapitre 3 (1).pptx initiation a la recherche
 
Les eleves en difficulte d'apprentissage de la lecture – Valdois, S
Les eleves en difficulte d'apprentissage de la lecture – Valdois, SLes eleves en difficulte d'apprentissage de la lecture – Valdois, S
Les eleves en difficulte d'apprentissage de la lecture – Valdois, S
 

Mehr von Francis Mary Rosa

Mehr von Francis Mary Rosa (10)

David hume e a critica à causalidade
David hume e a critica à causalidadeDavid hume e a critica à causalidade
David hume e a critica à causalidade
 
John cottingham dicionário de descartes [doc]
John cottingham   dicionário de descartes [doc]John cottingham   dicionário de descartes [doc]
John cottingham dicionário de descartes [doc]
 
ANÁLISE DO DISCURSO: UM ITINERÁRIO HISTÓRICO
ANÁLISE DO DISCURSO: UM ITINERÁRIO HISTÓRICOANÁLISE DO DISCURSO: UM ITINERÁRIO HISTÓRICO
ANÁLISE DO DISCURSO: UM ITINERÁRIO HISTÓRICO
 
A Ordem discurso
A Ordem discursoA Ordem discurso
A Ordem discurso
 
Senso comum e ciência
Senso comum e ciênciaSenso comum e ciência
Senso comum e ciência
 
Senso comum e ciência
Senso comum e ciênciaSenso comum e ciência
Senso comum e ciência
 
Generos alemao
Generos alemaoGeneros alemao
Generos alemao
 
Generos alemao
Generos alemaoGeneros alemao
Generos alemao
 
Orthographe
OrthographeOrthographe
Orthographe
 
Aparelho locomotor articulacoes
Aparelho locomotor articulacoesAparelho locomotor articulacoes
Aparelho locomotor articulacoes
 

Analyse du discours

  • 1. Zellig S. Harris Mme Françoise Dubois-Charlier Analyse du discours In: Langages, 4e année, n°13, 1969. pp. 8-45. Citer ce document / Cite this document : Harris Zellig S., Dubois-Charlier Françoise. Analyse du discours. In: Langages, 4e année, n°13, 1969. pp. 8-45. doi : 10.3406/lgge.1969.2507 http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1969_num_4_13_2507
  • 2. Résumé L'analyse du discours effectue les opérations suivantes sur tout texte suivi, considéré individuellement. Elle rassemble les éléments (ou séquences d'éléments) dont les environnements à l'intérieur d'une phrase sont identiques ou équivalents, et les considère comme équivalents entre eux (c'est-à-dire, membres de la même classe d'équivalence). Le matériau qui n'appartient à aucune classe d'équivalence est associé au membre (d'une classe) avec lequel son rapport grammatical est le plus étroit. On divise les phrases du texte en segments, constitués chacun d'une succession de classes d'équivalence, de façon à ce que chaque segment obtenu soit aussi semblable que possible, par des classes qui le composent, aux autres segments du texte. On examine alors la succession des segments pour repérer la distribution des classes qu'elle offre et, en particulier, pour repérer des schémas d'occurrence de classes. Ces opérations ne font appel à aucune connaissance concernant le sens des morphèmes, l'intention de l'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphèmes, y compris les junctures de phrase et autres intonations morphologiques (ou ponctuation). L'application de ces opérations peut être renforcée par l'utilisation des équivalences grammaticales (ou rapports d'occurrence de morphèmes individuels), tirées de toute la langue ou du corps linguistique dont le texte en question fait partie. Dans ce cas, il est nécessaire de connaître les classes grammaticales des différents morphèmes du texte. L'analyse du discours donne une foule de renseignements sur la structure d'un texte ou d'un type de texte, ou sur le rôle de chaque élément dans cette structure. La linguistique descriptive, elle, ne décrit que le rôle de chaque élément dans la structure de la phrase qui le contient. L'analyse du discours nous apprend, de plus, comment un discours peut être bâti pour satisfaire à diverses spécifications, exactement comme la linguistique descriptive construit des raisonnements raffinés sur les façons dont les systèmes linguistiques peuvent être bâtis pour satisfaire à diverses spécifications. L'analyse du discours donne aussi des renseignements sur des fragments de discours plus longs que la phrase; ainsi, il se révèle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sont pas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prédicat, etc.), mais le sont dans le scheme d'occurrence des classes d'équivalence dans les phrases successives.
  • 3. ZELLIG S. HARRIS Université de Pennsylvanie ANALYSE DU DISCOURS * Cet article présente une méthode d'analyse de l'énoncé suivi (écrit ou oral) que nous appellerons discours 1. C'est une méthode formelle qui ne se fonde que sur l'occurrence des morphèmes en tant qu'éléments iso- lables; elle ne dépend pas de la connaissance que le linguiste qui analyse peut avoir du sens spécifique de chaque morphème, et elle ne nous apprend rien de nouveau sur le sens particulier de chacun des morphèmes qui figurent dans le discours en question. Mais ceci ne signifie nullement que nous ne puissions pas découvrir autre chose que la manière dont la gram maire de la langue s'illustre dans ce discours. Car, bien que nous usions de procédures formelles, proches de celles de la linguistique descriptive, nous pouvons obtenir sur le texte étudié des renseignements que cette dernière ne fournissait pas. Cette information supplémentaire provient d'un fait fondamental : l'analyse de l'occurrence des éléments dans le texte n'est faite qu'en fonction de ce texte particulier; c'est-à-dire en fonction des autres éléments de ce même texte et non en fonction de ce qui existe ailleurs dans la langue. En conséquence, nous repérons les corrélations spécifiques des morphèmes du texte tels qu'ils se présentent dans ce texte et, ce faisant, nous décou vrons quelque chose de sa structure, de ce qui s'y passe. Il se peut que nous ne sachions pas exactement ce que le texte dit, mais nous pouvons déterminer comment il le dit — ce que sont les schemes de récurrence des principaux morphèmes qui le forment. * Cet article est paru en anglais dans Language, vol. 28, 1952, pp. 1-30. Nous remer cionsM. Z. Harris et la Société de Linguistique d'Amérique qui nous ont autorisés à le publier en français. 1. J'ai le plaisir de remercier ici de leur collaboration trois hommes qui m'ont aidé dans la mise au point de la méthode et dans l'analyse de divers textes : Fred Lukoff, Noam Chomsky et A. F. Brown. Les recherches antérieures dans la perspective de cette méthode avaient été présentées par Lukoff dans Preliminary analysis of the linguistic structure of extented discourse (University of Pennsylvania Library [1948]). Une analyse détaillée d'un texte-échantillon a paru dans « Discourse analysis : a sample text » de Z. Harris, Language, vol. 28, n° 4, 1952, p. 474.
  • 4. 9 On peut déterminer des schemes définis pour des textes donnés, pour des individus, des styles ou des thèmes donnés. Dans certains cas on peut tirer des conclusions formelles du scheme spécifique de distribution des morphèmes dans un texte. Et il est souvent possible de mettre en évidence des différences de structure régulières entre les discours tenus par des personnes différentes, ou dans des styles ou sur des thèmes différents. Préliminaires 1. — Le problème. On peut envisager l'analyse du discours à partir de deux types de problèmes qui, en fait, sont liés. Le premier concerne le prolongement de la linguistique descriptive au-delà des limites d'une seule phrase à la fois. Le second concerne les rapports entre la « culture » et la langue (c'est-à-dire entre le comportement non-verbal et le comportement verbal). Le premier problème se pose parce que la linguistique descriptive s'arrête généralement aux limites de la phrase. Ceci ne résulte pas d'une décision a priori, car les techniques linguistiques ont été élaborées pour permettre d'étudier tout énoncé, quelle qu'en soit la longueur; mais il se trouve que, dans toutes les langues, presque tous les résultats obtenus concernent un type d'énoncé relativement court qu'on peut appeler phrase. Autrement dit, quand on établit une interdépendance dans l'occurrence de deux éléments A et B, il se trouve presque toujours que ces deux él éments sont considérés comme se présentant dans une même phrase. On peut dire, par exemple, que les adjectifs anglais se trouvent avant le nom ou après certains verbes (dans la même phrase) : the dark clouds, the future seems bright, mais il est rare que nous puissions établir des interdépen dances dépassent les limites de la phrase, par exemple si le verbe qui principal d'une phrase a tel suffixe de temps, le verbe principal de la phrase suivante aura tel autre suffixe de temps. Nous ne pouvons pas dire que, si une phrase est; de la forme NV, la suivante sera de la forme N. Tout ce que nous pouvons dire, c'est que la plupart des phrases sont de la forme NV, que quelques-unes sont de la forme N, etc., et que ces structures figurent dans diverses séquences. C'est ainsi que la linguistique descriptive, partie pour décrire les occurrences d'éléments dans tout énoncé quelle qu'en soit la longueur, les décrit finalement surtout en fonction des autres éléments de la même phrase. On ne s'est pas trop inquiété de cette limitation, parce qu'elle n'a pas empêché l'élaboration de grammaires adéquates : la grammaire expose la structure des phrases; le locuteur construit chaque phrase par ticulière conformément à cette structure et produit sa propre séquence de phrases. L'autre problème, celui des rapports entre le comportement (ou
  • 5. 10 situation sociale) et la langue, a toujours été considéré comme extra linguistique. La linguistique descriptive ne se préoccupe pas du sens des morphèmes et, bien qu'on puisse essayer de tourner la difficulté en parlant, non de sens, mais de la situation sociale et intersubjective dans laquelle l'énoncé est produit, la linguistique descriptive n'est pas armée pour tenir compte de la situation sociale : elle peut seulement définir l'occurrence d'un élément linguistique en fonction de l'occurrence d'autres éléments linguistiques. Les études menées sur les rapports entre la « culture » et la langue n'ont donc pas pu bénéficier des travaux distributionnels récents. Ainsi, elles font l'inventaire des sens exprimés dans la langue en étudiant le stock lexical; ou elles tirent des conclusions du fait que, dans une cer taine langue, un certain groupe de sens s'exprime par le même morphème; ou elles discutent des nuances de sens et d'emploi d'un mot en le rappro chantd'autres (par exemple en stylistique). Elles ont aussi souligné cer tains points comme le fait qu'il faut considérer le sens global des syn- tagmes et non la somme des sens des morphèmes qui les constituent : ainsi « How are you? » est une formule de politesse plutôt qu'une question sur la santé de l'interlocuteur. Cet exemple illustre bien la corrélation entre le discours et la situation sociale. De même on a étudié des caracté ristiques de la personnalité dans l'énoncé en rapprochant les traits li nguistiques récurrents d'un individu avec des traits récurrents de son comportement et de sa sensibilité 2. 2. — Distribution a l'intérieur du discours. L'analyse distributionnelle ou combinatoire à l'intérieur d'un dis cours considéré comme un tout spécifique se révèle pertinente pour l'étude de ces deux problèmes. D'une part, elle nous permet de dépasser la limitation à la phrase de la linguistique descriptive. Alors que nous ne pouvons pas définir la distribution des phrases (ou plus généralement une quelconque relation entre les phrases) dans un ensemble arbitraire de phrases prises dans une. langue donnée, nous pouvons obtenir des résultats précis sur certaines relations dépassant les limites de la phrase si nous ne considérons que les phrases d'un seul discours suivi, c'est-à-dire celles qui ont été prononcées ou écrites les unes à la suite des autres par une ou plusieurs personnes dans une seule situation. Cette limitation de l'analyse au discours suivi n'en diminue pas l'utilité, puisque toutes les occurrences de la langue ont une cohérence interne. La langue ne se présente pas en mots ou phrases 2. Nous considérons que les corrélations entre personnalité et langue ne sont pas simplement liées aux corrélations entre culture et langue, mais qu'elles en sont un cas particulier. La raison d'être de ce point de vue est que la plupart des caractéristiques individuelles d'un énoncé (à distinguer des caractéristiques phonétiques) sont en cor rélation avec les particularités de personnalité qui proviennent de l'expérience de l'i ndividu dans des situations interpersonnelles conditionnées socialement.
  • 6. 11 indépendantes, mais en discours suivi, que ce soit un énoncé réduit à un mot ou un ouvrage de dix volumes, un monologue ou une discussion politique. Les ensembles arbitraires de phrases ne présentent en fait aucun intérêt, si ce n'est pour vérifier la description grammaticale; et il n'y a rien d'étonnant à ce que nous ne puissions pas trouver d'interdépen dance entre des phrases ainsi assemblées. La succession des phrases dans un discours suivi constitue, au contraire, un domaine privilégié pour les méthodes de la linguistique descriptive, puisque celles-ci ont pour objet la distribution relative des éléments à l'intérieur d'un énoncé suivi quelle que soit sa longueur. D'autre part, l'analyse distributionnelle à l'intérieur d'un seul dis cours, considéré individuellement, fournit des renseignements sur certaines corrélations entre la langue et d'autres formes de comportement. La raison en est que chaque discours suivi est produit dans une situation précise — qu'il s'agisse d'une personne qui parle, ou d'une conversation, ou de quelqu'un qui se met de temps en temps à son bureau pendant un certain nombre de mois pour écrire un type défini de livres dans une certaine tradition, littéraire ou scientifique. Cette co-occurrence de la situation et du discours ne signifie pas, bien entendu, que les discours produits dans des situations semblables doivent nécessairement avoir certaines carac téristiques , formelles en commun, ni que les discours produits dans des situations différentes doivent présenter certaines différences formelles; elle ne fait qu'expliquer ou permettre l'existence de ces corrélations for melles. Il reste à prouver, à partir de données de fait, que ces corrélations formelles existent bien en effet, que les discours d'un individu, d'un groupe social, ou relevant d'un style particulier, ou portant sur un certain thème, , présentent non seulement des significations propres (dans leur choix des morphèmes), mais aussi des traits formels caractéristiques. Nous ne parlerons pas ici du choix particulier des morphèmes, mais on peut étudier les caractéristiques formelles de ces discours par des méthodes distributionnelles appliquées à l'intérieur de chaque texte; et le fait de leur corrélation avec un certain type de situation donne un statut de signification! à l'occurrence de ces caractéristiques formelles. 3. — Combinaison, avec la grammaire. On voit donc que la méthode présentée ici vient d'une application des méthodes distributionnelles de la linguistique à un discours à la fois, considéré comme un tout' spécifique. On peut s'en servir directement sur un texte, sans faire appel pour son étude à aucune connaissance linguis tiqueautre que les limites des morphèmes; ceci est possible parce que l'analyse distributionnelle est une méthode élémentaire, qui consiste sim plement à établir l'occurrence relative des éléments qui, dans le cas parti-
  • 7. 12 culier, sont des morphèmes. Pour montrer la validité de la méthode, ou pour pouvoir éventuellement l'appliquer à un matériau non-linguistique, il convient de n'utiliser aucune autre connaissance préalable que les limites des éléments. Si cependant nous nous intéressons non seulement à la méthode, mais encore à ses résultats, si nous voulons l'utiliser pour découvrir tout ce qu'il est possible de trouver sur un texte particulier, il est utile de la combiner avec la linguistique descriptive. Dans ce but, il ne faut utiliser que les règles de la grammaire de la langue en question qui sont vraies pour toute phrase ayant une forme donnée. Par exemple, à partir de toute phrase française de la forme Nj V N2 (Ainsi le chasseur tue le lion), on peut obtenir une phrase où l'ordre des syntagmes nominaux est inverse N2 — Nx (le lion — le chasseur) en changeant la forme verbale 3, le lion est tué par le chasseur. Le recours à ce genre d'informations grammaticales, dans l'analyse d'un texte, se justifie par le fait que, puisque cette règle s'applique à toute phrase française de la forme N2 V N2, elle doit donc aussi être applicable à toute phrase de la forme N-|_ V N2 du texte qui nous intéresse, à la seule condition, naturellement, que ce soit du français. Et ce recours à la grammaire permet dans bien des cas de pousser plus loin l'application de la méthode d'analyse du discours. Nous verrons ceci plus en détail à la section 7.3.; mais il faut signaler ici que cet usage de l'information grammaticale ne remplace pas le travail qui pourrait être effectué par la méthode d'analyse du discours et n'affecte en rien l'autonomie de cette méthode, il ne sert qu'à transformer certaines phrases du texte en phrases grammaticalement équivalentes (cf. ci-dessus la transformation de Nj V N2 en N2 V* Nx), pour rendre plus aisée l'appli cation de la méthode d'analyse du discours, ou pour la rendre possible dans certains passages du texte où elle ne l'était pas auparavant. Et nous verrons qu'il ne s'agit pas de décider arbitrairement quand et comment appliquer ces transformations grammaticales, mais que c'est la structure même du texte qui les détermine. On peut pousser plus avant encore l'application de la méthode d'ana lyse discours dans des textes particuliers si on utilise, non seulement les du résultats ordinaires de la grammaire, mais si on introduit également dans la linguistique descriptive l'étude des distributions spécifiques des mor phèmes individuels; dans certains cas, en effet, comme on le verra à la section 7.3., on aimerait pouvoir avoir des renseignements non plus sur toute une classe de morphèmes (comme la transformation de tout V en V*), mais sur un certain membre de cette classe, sur une restriction d'oc currence qui est vraie pour ce morphème-là, mais non pour les autres; on n'a pas toujours à l'heure actuelle de tels renseignements, mais il est pos- 3. Dans ce cas de transformation du verbe correspondant à une inversion du sujet (N1 ci-dessus) et de l'objet (N2), on appellera la nouvelle forme verbale « forme conjointe de la première » et on l'écrira V*. La forme conjointe d'un verbe actif est donc le passif et vice versa.
  • 8. 13 sible de les obtenir par des méthodes qui, fondamentalement, sont celles de la linguistique descriptive. Enfin, on peut quelquefois pousser plus avant l'application de l'ana lysedu discours dans des textes particuliers en tirant des renseignements non seulement de la grammaire de la langue mais aussi d'une analyse des criptive de l'ensemble, écrit ou parlé, dont le texte fait partie : on peut considérer cette masse plus vaste de matériau comme le dialecte dans lequel a été écrit ou dit le texte en question, et on peut dire, comme préc édemment, que toute conclusion distributionnelle vraie pour toutes les phrases d'une forme donnée dans ce dialecte est vraie aussi de toute phrase de cette forme dans le texte en question. La méthode 4. — Nature de la méthode. Nous avons soulevé deux questions : celle des rapports distribution- nels entre les phrases, et celle de la corrélation entre la langue et la situa tion sociale. Nous avons suggéré qu'on peut obtenir des renseignements concernant ces deux problèmes grâce à l'analyse formelle d'un discours pris comme un tout spécifique. Quel genre d'analyse faudrait-il utiliser? Pour en décider, considérons ce que permet le matériau. Puisque le matériau consiste simplement en une séquence de formes linguistiques disposées en phrases successives, toute analyse formelle se limite à localiser des éléments linguistiques à l'intérieur de ces phrases, c'est-à-dire à établir les occurrences d'éléments; à moins d'introduire de l'extérieur des informations nouvelles, nous ne pouvons pas étudier la nature ou la composition de ces éléments, où leur corrélation avec des caractéristiques non-linguistiques. Qui plus est, il n'y a pas d'éléments spéciaux qui soient a priori plus importants que les autres, comme mais, ou je, ou communisme, qui nous conduiraient à nous intéresser au simple fait de leur absence ou de leur présence dans notre texte. Toute analyse qui tendrait à découvrir la pré sence ou l'absence dans un texte de certains mots particuliers choisis par le linguiste, serait une recherche sur le contenu du texte, qui reposerait finalement sur le sens des mots choisis. Si nous ne nous appuyons pas sur le sens dans notre analyse, les seuls morphèmes — ou les seules classes — que nous puissions traiter séparément sont ceux qui présentent des parti cularités de distribution établies grammaticalement. Puisque nous ne nous intéressons donc pas, en général, à tel ou tel élément choisi à l'avance, mais bien aux éléments qui figurent dans le texte, il est évident que nous ne voulons pas simplement affirmer tauto-
  • 9. 14 logiquement qu'ils figurent; nous chercherons à établir empiriquement comment ils figurent, — lesquels se trouvent toujours à côté de quels autres, ou dans le même environnement que quels autres, etc., — c'est- à-dire l'occurrence relative de ces éléments les uns par rapport aux autres» En ce sens notre. méthode se rapproche» plus de celle queJ!on< utilise pour élaborer la grammaire d'une langue (qui établit; les. rapports distribution- nels entre les .éléments), que de celle que l'on (utilise pour en j élaborer le • dictionnaire (qui dresse la liste de tous les éléments de cette langue, sans se préoccuper de, leurs .positions). Enfin, puisque, le matériau est une suite -finie de. phrases, ce que nous aurons établi sur la distribution.de chaque élément ne peut être valable que dans les limites de cette séquence de phrases — que ce soit un paragraphe ou un livre. Nous verrons plus loin (7.3.) qu'on peut parfois utiliser des renseignements concernant la distribution d'un élément hors du texte consi déré; mais ceci ne peut être qu'un auxiliaire extérieur, à n'utiliser que lorsque la distribution de cet élément dans le texte a été complètement établie. 5. — Aperçu général de la méthode. Il résulte de tout ce qui précède que notre méthode devra établir les occurrences d'éléments et en particulier les occurrences relatives de tous les éléments d'un discours dans les limites de ce seul discours. 5.1. Éléments dans des environnements identiques. Pour satisfaire à cette nécessité, nous pourrions. formuler de façon détaillée la distribution de chacun des éléments dans le discours — de même qu'en linguistique descriptive nous pourrions établir des formules individuelles rendant compte de tous les environnements (c'est-à-dire de la distribution) de chaque élément dans les différentes phrases d'une langue. Mais ces formules individuelles sont de dimension impossible pour toute une langue et, même pour un seul texte, elles sont difficiles à manier. De plus, dans les deux cas, elles ne constituent pas une base satisfaisante pour procéder à une analyse comparée et pour en déduire des conclusions générales. C'est pourquoi, dans l'analyse du discours, comme en linguistique descriptive, on regroupe les éléments qui ont des distribu tions semblables en une classe et, à partir de là, on parle de la distribution de la classe considérée comme un tout plutôt que de celle de chacun des éléments pris séparément. Quand deux éléments ont des distributions identiques, cette opération de regroupement ne présente aucune difficulté. En linguistique descriptive, cependant, c'est rarement le cas, car peu de mots ont des distributions
  • 10. 15 identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus fr équemment dans un texte répétitif, où deux mots peuvent être toujours employés dans des phrases parallèles identiques — comme par exemple dans les légendes à style en écho, dans les proverbes, dans les slogans, ou dans les rapports scientifiques « secs », mais précis. 5.2. Éléments à environnements équivalents. Il est plus fréquent que deux éléments se présentent dans des env ironnements qui sont presque identiques, sans l'être tout à fait; nous pour rons peut-être alors les regrouper en une seule classe distributionnelle en dressant une chaîne d'équivalences qui lie les deux environnements presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand on dit, par exemple, qu'en. français la classe des adjectifs A se rencontre après la classe des noms N, en dépit du fait qu'un certain A (courageuse par exemple) peut ne jamais figurer après un certain N (table par exemple). C'est ce qu'on fait en analyse du discours quand on dit que deux parties de l'énoncé, qui ont le même environnement à un endroit, sont équivalentes même en un autre endroit où elles n'ont pas le même environnement. Supposons par exemple que le texte contienne les quatre phrases suivantes : Ici les feuilles tombent vers le milieu de l'automne Ici les feuilles tombent vers la fin du mois d'octobre Les premiers froids arrivent après le milieu de l'automne Nous commençons à chauffer après la fin du mois d'octobre. Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre sont équivalents parce qu'ils se présentent dans le même environnement (Ici les feuilles tombent vers) et que cette équivalence passe dans les phrases 3 et 4. Ceci posé, on peut aller plus loin et dire que Les premiers froids arrivent et Nous commençons à chauffer se présentent dans des env ironnements équivalents (le mot en supplément après est identique dans les deux environnements). L'élaboration de ces chaînes, qui font passer l'équivalence de deux parties de l'énoncé d'une paire de phrases où leur environnement est vraiment identique, à une autre paire de phrases où il ne l'est pas, doit naturellement présenter de sérieuses garanties, sinon tout devient équivalent à tout et l'analyse s'effondre. On a le même pro blème quand on établit les classes en linguistique descriptive. Nous verrons plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse du discours. De façon plus générale, si nous avons dans notre texte les séquences 4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le reste, mais qui contient Jim à la place de Bill. 5. Des travaux inédits de N. Chomsky m'ont aidé à mieux comprendre l'usage de ces chaînes.
  • 11. 16 AM et AN, nous dirons que M est équivalent à N, ou que M et N se pré sentent dans un même environnement A, ou que M et N se présentent tous deux comme l'environnement d'un même élément (ou séquence d'éléments) A; et nous écrirons M = N. Si nous trouvons alors dans notre texte BM et CN (ou MB et NC), nous dirons que B est équivalent à C (au second degré), puisque B et C se trouvent dans des environnements M et N, dont nous avons établi l'équivalence, et nous écrirons B = C. Puis, si nous trouvons BK et CL, nous écrirons K = L, puisqu'ils se trouvent dans les environ nements B et C équivalents au second degré, et ainsi de suite. A titre d'exemple, continuons notre fragment de texte par la phrase suivante : Nous avons toujours des tas d'ennuis quand nous commençons à chauffer, mais il faut bien être prêt quand les premiers froids arrivent. Nous dirons que Nous avons toujours des tas d'ennuis est équivalent (dans ce texte) à mais il faut bien être prêt. Dire que B = C ne veut pas dire qu'ils sont égaux en général, ni qu'ils signifient la même chose; on utilise le signe = pour l'unique raison que le rapport entre B et C satisfait aux exigences techniques du rapport communément symbolisé par ce signe; quand nous posons B = C, cela signifie seulement que ce rapport est une étape dans une chaîne d'équiva lencesd'une part B et C se rencontrent dans des environnements équi : valents (M et N); d'autre part deux environnements (K et L), quels qu'ils soient, dans lesquels se trouvent B et G seront considérés équivalents. Il ne sert à rien de soulever des questions comme « Est-il vrai que B = C? » ou « A-t-on le droit de dire que K = L, simplement parce qu'on a B = G et qu'on trouve BK et CL? ». Tout ce que nous proposons ici est une méthode d'analyse, les seules questions pertinentes sont de savoir si la méthode est utilisable et si elle conduit à des résultats intéressants et valables. On jugera si la méthode est utilisable en se fondant sur ses opérations, sans se préoccuper de ses résultats, que nous n'avons pas encore vus. Quant aux résultats, nous en étudierons l'intérêt aux para graphes 8, 9 et 10, où nous verrons que les chaînes d'équivalences révèlent une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le « droit » de poser K = L, puisque tout ce que nous signifions par K = L est qu'on trouve BK et CL et que B = C; la justification viendra du fait qu'en regroupant toutes les équivalences, on trouve quelque chose sur la structure du texte. 5.3. Classes d'équivalences. Après avoir établi quelles sont les séquences qui se rencontrent dans des environnements équivalents, nous pouvons les regrouper en une seule classe d'équivalence. Nous avons les formules A = B (tous deux se ren contrent devant N) et B = C, nous considérerons donc A, B et C comme membres d'une même classe d'équivalence. De même, M, N, K, L sont tous membres d'une autre même classe d'équivalence. Reprenons notre exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent après
  • 12. 17 (To) et Nous commençons à chauffer après (T3) sont tous trois membres d'une classe d'équivalence T, tandis que le milieu de V automne (Ex) et la fin du mois d'octobre (E2) sont membres d'une autre classe d'équivalence E. Il y a encore une troisième classe d'équivalence E' composée de nous avons toujours des tas d'ennuis quand et mais il faut bien être prêt quand. Il y a visiblement un rapport entre E' et E puisque tous deux se rencontrent avec les deux derniers membres de T. Mais E se trouve après T, tandis que E' se trouve avant T. En fonction de ces classes, on peut écrire les cinq phrases du fragment de texte en six formules (la dernière phrase est double) : TE, TE, TE, TE, E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe, mais on peut dire que, quand l'ordre de E et T est inversé (quand E se réfléchit dans T), on a E' à la place de E. Si on modifie les membres de E' pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le précéder, ils deviennent des membres réguliers de E. Par exemple, on pourrait dire Nous commençons à chauffer avec toujours des tas d'ennuis mais les premiers froids arrivent si brusquement qu'il faut bien être prêt. Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours beaucoup d'ennuis est un membre deE en vertu de son occurrence après T; appelons le E3; il faut naturellement montrer qu'il est équivalent à Nous avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse par rapport à T; nous verrons au paragraphe 7.3. à quelles techniques on fait appel pour établir cette équivalence. De même il faut montrer que le nouveau syntagme E « mais... si brusquement qu'il faut bien être prêt (E4) est le réfléchi dans T du syntagme E' mais il faut bien être prêt quand. Si on peut établir ces deux équivalences, on peut remplacer les deux syntagmes E' par les syntagmes modifiés qu'on obtient quand on les met en position E. Nous obtenons par conséquent deux membres de plus dans E, et la classe E' n'existe plus. On peut ainsi dresser des classes d'équivalence (comme E) de toutes les séquences qui ont des environnements équivalents, à l'intérieur du texte, c'est-à-dire les mêmes classes d'équivalence d'un même côté (avant ou après). Les éléments (ou séquences d'éléments) qui appartiennent à la même classe d'équivalence sont dits équivalents les uns aux autres, ou substituts les uns des autres : nous verrons plus loin (paragraphe 10) que, par certains côtés (en particulier dans les extensions du texte), on peut les considérer comme interchangeables ou substituables; dans ce cas la classe d'équivalence peut aussi s'appeler une classe de substitution. 11 est à remarquer que l'opération consistant à grouper dans une même classe d'équivalence des formes non identiques, ne repose pas sur le fait que leurs petites différences de sens sont considérées comme négligeables, mais sur le fait qu'on les trouve dans des environnements équivalents, ce qui signifie qu'on les trouve soit dans des environnements identiques (le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux dans l'environnement les feuilles tombent vers), soit dans des environne-
  • 13. 18 ments qui sont aux extrémités d'une chaîne d'équivalences garantie (Les premiers froids arrivent et Nous commençons à chauffer se trouvent dans les environnments équivalents après le milieu de l'automne et après la fin du mois d'octobre). Notre méthode est donc essentiellement celle de la linguistique descriptive et non celle de la sémantique. 5.4. Ordres de phrase. Nous en arrivons maintenant à une opération que n'emploie pas la linguistique descriptive, à savoir la représentation de l'ordre des occur rences successives des membres d'une classe. En linguistique descriptive, le seul ordre considéré est la position relative des différentes parties d'une séquence : on décrit, par exemple, l'ordre de l'article et du nom en disant que le premier précède le second dans la chaîne du syntagme nominal. Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties de la phrase, par exemple les ordres différents de E et E' par rapport à T. L'ordre des phrases successives ou d'une certaine classe de mots dans différentes phrases (par exemple la relation entre des sujets successifs) n'intéresse généralement pas la linguistique descriptive, car les formules distributionnelles qu'elle définit ne s'appliquent normalement qu'à l'inté rieur d'une seule phrase à la fois. Dans notre cas cependant, où il s'agit de tout un discours, le problème existe. Si nous considérions chaque phrase séparément, en ne la rapprochant des autres que pour comparer des struc tures, nous pourrions dire (comme en linguistique descriptive) que chacune des phrases de notre fragment de texte consiste en TE. Mais, puisque nous considérons le texte comme un tout, nous ne pouvons dire qu'il consiste simplement en 6 fois TE : les membres de E et de T sont différents dans les diverses phrases; et leurs différences preuvent être particulières à ce texte, ou à un groupe de texte semblables. Nous pouvons représenter structurellement notre fragment de texte par un tableau à double entrée, l'axe horizontal représentant la matière qui se présente à l'intérieur d'une seule phrase ou sous-phrase, l'axe ver tical (ici divisé en 2 parties) représentant les phrases successives. Ti Ex T3 E2 Dans ce tableau à double entrée, les différents symboles dans la rangée horizontale représentent les différentes parties d'une seule phrase ou sous-phrase du texte, dans l'ordre dans lequel elles se présentent dans la phrase (sauf dans la mesure où l'ordre a été modifié par des transfor mations explicites comme pour le passage de E' à E). Les colonnes verti cales indiquent les différents membres d'une classe d'équivalence, dans l'ordre d'apparition des phrases où ils figurent. Le fait que l'ordre des symboles d'une rangée puisse être différent de l'ordre des éléments dans la phrase correspondante tient à ce que nos
  • 14. 19 connaissances linguistiques de la structure de phrase nous permettent de traiter les éléments indépendamment de leur ordre. C'est ce que nous faisons quand nous ne tenons pas compte dans nos symboles d'un ordre automatique et qui réapparaîtrait dès la retraduction de nos symboles en langue, — par exemple nous incluons mais... dans E4 même s'il en est nécessairement séparé dans la phrase réelle (puisque mais se trouve géné ralement au début d'une structure de phrase, quelle que soit la partie de la phrase à laquelle il se rapporte). C'est ce que nous faisons également quand nous remplaçons un certain ordre non automatique à valeur mor phologique par les morphèmes qui sont grammaticalement équivalents à cet ordre : ainsi quand, par exemple, nous remplaçons NXV N2 par N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tué par le chasseur) ou quand, dans notre fragment de texte, nous remplaçons E' avant T par E après T. Contrairement au traitement cavalier de l'ordre horizontal, nous ne pouvons rien changer à l'ordre dans une colonne verticale : nous n'avons là aucune connaissance linguistique a priori qui nous dise quels agence ments de phrase sont automatiques (s'il y en a) et par conséquent à ne pas représenter, ni quels agencements peuvent être remplacés par des agen cements différents, mais équivalents. Une étude plus approfondie des séquences de phrases dans la langue nous donnera peut-être un jour des indications à ce sujet; elle établira peut-être, par exemple et pour prendre un cas très simple, que des séquences de phrases de la forme P parce que Q sont équivalentes à des séquences de la forme Q donc P, ou que P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'être pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une étude approfondie d'un certain texte ou de plusieurs textes d'un certain type montrera peut-être que certaines séquences de phrases tout entières sont interchangeables ou équivalentes; et, grâce à ces données, nous pourrons peut-être simplifier l'axe vertical du tableau à double entrée, en trouvant par exemple des schemes verticaux qui reviennent périod iquement. En attendant, l'axe vertical reste une reproduction exacte de l'ordre des phrases ou sous-phrases du texte. 5.5. Résumé. Nous pouvons maintenant avoir un aperçu général de la méthode. On dira que des éléments (parties de texte — morphèmes ou séquences de morphèmes) sont équivalents entre eux s'ils se présentent dans l'env ironnement d'autres éléments identiques ou équivalents. Tout ensemble d'éléments équivalents entre eux s'appelle une classe d'équivalence. 6. Les mathématiques, et plus encore la logique, ont déjà établi des ordres de phrase spécifiques qui sont équivalents. On peut redécouvrir linguistiquement cette équivalence en trouvant que la distribution de chaque phrase est équivalente à celle des autres. Mais nous cherchons plutôt ici à découvrir d'autres équivalences que celles que nous savons déjà faire partie du système.
  • 15. 20 Chaque phrase successive du texte est alors représentée par une séquence de classes d'équivalence, celles auxquelles ses différentes parties appar tiennent. Nous obtenons ainsi pour tout le texte un tableau à double entrée, l'axe horizontal représentant les classes d'équivalence contenues par une seule phrase, l'axe vertical représentant les phrases successives. Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.), mais des schemes d'occurrence des classes d'équivalences dans tout le texte. Si les différentes phrases contiennent des classes entièrement diffé rentes, ce tableau n'a pas d'intérêt; mais ce n'est généralement pas le cas. Il y a, dans presque tous les textes, des passages où certaines classes d'équivalence se répètent, dans les phrases successives, en un scheme caractéristique. Le tableau permet d'étudier ce scheme et on peut en tirer divers types d'information sur le texte, certaines analyses structur elles texte et certaines exégèses sur le texte. Pour les classes d'équi du valence, qui ont été établies distributionnellement, le tableau en montre la distribution. Pour le texte dans sa totalité, le tableau montre certaines caractéristiques de structure. 6. — Mode opératoire. Nous allons maintenant montrer la procédure en détail, en appli quant la méthode à un texte spécifique, d'un type très courant aujour d'hui7. Millions Can't Be Wrong Millions of consumer bottles of X- have been sold since its introduction a few years ago. And four out of five people in a nation wide survey say they prefer X- to any hair tonic they've used. Four out of five people in a nation wide survey can't be wrong. You too and your whole family will prefer X- to any hair tonic you've used! Every year we sell more bottles of X- to satis fiedcustomers. You too will be satisfied! 6.1. Détermination des classes d'équivalence. La première étape dans l'analyse du discours consiste à décider quels éléments doivent être considérés comme équivalents, donc placés dans la même colonne du tableau. Ce n'est pas toujours automatique, il ne s'agit pas simplement de trouver ceux des éléments qui ont des environne- 7. Ceci est le texte authentique d'un slogan, que nous avons trouvé sur une carte, qui selon toute vraisemblance, était accrochée à une bouteille de lotion capillaire. Un très grand nombre de slogans ont été analysés, car ils offrent un matériau clair et répét itif qui est relativement facile à manier, au stade où nous en sommes arrivés dans l'analyse du discours. On a aussi analysé de nombreux autres types de textes — des fragments de livres scolaires, de conversations, d'essais littéraires, etc., qui feront l'objet d'une prochaine publication.
  • 16. 21 ments identiques, car 1° il peut y avoir plusieurs façons de couper une phrase en parties équivalentes; et 2° il nous faut déterminer dans quelle direction chercher les chaînes d'équivalence qui sont moins évidentes. Le point de départ le plus simple est d'examiner les mots du texte qui sont le plus souvent répétés : presque tous les textes contiennent des mots très souvent répétés 8, qui sont souvent les mots-clés du texte. On peut en toute certitude mettre dans une seule colonne, c'est-à-dire dans une seule classe d'équivalence, les diverses occurrences de chacun de ces mots. Et on peut mettre dans une seule autre classe d'équivalence les mots voisins du mot-clé puisqu'ils se présentent dans des environnements identiques. Dans notre texte, il n'y a pas apparemment de mots-clés; mais nous pouvons partir de la séquence répétée can't be wrong, identique et donc naturellement équivalente : Millions est alors équivalent (pour ce texte) à Four out of five people in a nation wide survey, puisque tous deux se trouvent devant can't be wrong. Cette première étape pourrait aussi, bien entendu, être effectuée pour des mots répétés tels que of. Mais si nous devions regrouper tous les environnements du mot of, nous ne pourrions pas utiliser la classe d'équi valence qui en résulterait pour construire une chaîne d'autres équivalences, car on ne trouverait rien d'autre dans leur environnement. Tandis que la classe contenant millions et four out of five, que nous obtenons à partir des répétitions de can't be wrong, se révélera, dans les paragraphes sui vants, liée à d'autres parties de ce texte. En utilisant ainsi les répétitions, nous en venons à construire des chaînes d'équivalence : nous nous demandons quels autres environnements se présentent pour millions et four out of five... Pour millions nous avons un autre environnement, à savoir of consumer bottles, etc., mais nous verrons plus tard (paragraphe 9) que cet environnement s'oppose aux environnements de four out of five; nous laisserons donc provisoirement de côté la séquence of consumer bottles, etc. Quant à Four out of five in a nation wide survey, nous le trouvons dans un autre environnement say they prefer X- to any hair tonic they 've used. Nous suivons cette chaîne d'équivalence en cherchant un autre env ironnement dans lequel say they prefer X- se trouve; il y a bien une autre occurrence de cette séquence, mais elle se différencie de la première par you à la place de they. A première vue, il paraît donc impossible de consi dérer ces deux séquences comme équivalentes, puisque notre méthode ne donne aucune technique d'approximation, aucun moyen d'estimer une différence plus ou moins grande, qui puisse nous permettre de 8. Ceci est même vrai, bien qu'à un moindre degré, dans des textes écrits par ceux qui respectent les consignes scolaires concernant l'emploi des synonymes pour éviter les répétitions. Dans ce cas, on trouvera souvent les synonymes dans les mêmes env ironnements que le mot originel à ne pas répéter. Au contraire, quand un auteur a inten tionnellement utilisé un mot différent pour exposer une nuance particulière de sens que ce mot exprime, il y aura souvent une différence correspondante entre les environ nements du synonyme et du mot originel.
  • 17. 22 dire que ces deux séquences sont assez semblables pour être considérées comme équivalentes. En fait, puisque nous n'opérons pas sur le sens des morphèmes, le remplacement de they par you pourrait constituer une différence importante (comme ce serait le cas si tout le texte traitait de la distinction entre you et they). Telles quelles, ces deux séquences ne seraient donc pas rapprochées par notre méthode; tout ce que cette méthode pourrait faire, serait de trier les parties identiques et les parties diffé rentes. En fait il se trouve cependant qu'un examen un peu plus appro fondi montre que ces deux séquences sont contextuellement identiques — c'est-à-dire identiques quant à leur environnement pertinent ou contexte. On verra cela au paragraphe 7.1. Dans l'élaboration des chaînes d'équivalence, il importe de se confor mer rigoureusement aux exigences formelles de la méthode, ceci constitue la première garantie; si nous ne faisons jamais d'approximations, si nous ne négligeons jamais une « petite » différence dans l'environnement, nous serons assurés que deux membres quelconques d'une même classe d'équi valence ont au moins un environnement en commun. Si nous voulons mettre dans une même classe deux éléments alors qu'aucun environne ment de l'un n'est identique à un environnement de l'autre, il nous faudra ajouter à la méthode un postulat explicite, qui rendra égaux deux env ironnements ou neutralisera leur différence. Il faut enfin examiner, quand on se demande s'il faut inclure ou non deux éléments dans une même classe d'équivalence, comment fonctionner ait, l'analyse du texte, la classe qui résulterait de cette inclusion, dans c'est-à-dire le genre de tableau à double entrée que l'on obtiendrait en utilisant cette classe : ce facteur doit jouer un rôle, car il y a souvent plusieurs chaînes d'équivalence possibles qui satisfont à la méthode. Il ne s'agit pas de considérer des critères externes, comme la longueur de la chaîne par exemple; il s'agit plutôt de chercher une distribution syst ématique des classes, c'est-à-dire d'essayer d'établir en termes de ces classes un certain fait structurel sur le texte. Autrement dit, nous essayons de dresser des classes telles qu'elles aient une distribution intéressante pour notre texte. On pourrait penser que c'est une garantie plutôt cir culaire pour la construction des chaînes d'équivalence; mais cela signifie simplement que toutes les fois que nous devons décider s'il faut pousser plus loin une chaîne d'équivalence, nous étudions comment le nouveau jalon s'inscrira dans notre texte analysé, tel qu'il se présentera une fois représenté en fonction de cette nouvelle classe. On utilise aussi ce genre de considération en linguistique descriptive quand on doit décider, par exemple, jusqu'où aller dans la subdivision d'une séquence phonologique en morphèmes 9. 9. Cf. Methods in structural Linguistics, p. 160, de Harris (Chicago, 1951). Il va sans dire que cet emploi vague de la prévision est une formulation préliminaire. Des analyses poussées montreront ce que l'on peut attendre des différents types de chaînes d'équi valence, et permettront ainsi une formulation plus précise des garanties.
  • 18. 23 On pourrait demander de quel droit nous mettons deux mots dans une même classe d'équivalence pour l'unique raison qu'ils se présentent tous deux dans le même environnement. Ce à quoi nous répondrons que la classe d'équivalence indique seulement ce que font distributionnelle- ment ses membres dans le texte : si, dans ce texte, deux mots ne se pré sentent que dans des environnements identiques ou équivalents, alors, dans ce texte, il n'y a pas de différence dans leur distribution (à part leur ordre dans la colonne, qui est préservé). Nous ne nions pas qu'il puisse y avoir des différences de sens ou de distribution en dehors de ce texte. Nous avons jusqu'ici reconnu deux classes d'équivalence. L'une, que nous appellerons P, contient pour l'instant : Millions Four out of five people in a nation wide survey l'autre, que nous appellerons W, contient pour l'instant : Can't be wrong sag they prefer X- to any hair tonic they've used. 6.2. Segmentation. Dès que nous voyons à peu près quelles classes d'équivalence nou& voudrions expérimenter dans notre texte, nous le divisons en segments successifs de manière à avoir, dans chaque segment, des occurrences semblables des mêmes classes d'équivalences. Si nous avons jusqu'ici les classes P et W et si nous avons quelques successions de la forme PW, nous essayons de les diviser en segments contenant chacun exactement un P et un W. Par exemple, le titre du slogan est représenté par PW. La pre mière phrase après le titre paraît contenir un P (le mot Millions), mais le reste de la phrase n'est pas égal à W et ne le contient pas; on laisse donc la phrase non analysée, et même son P est-il douteux. L'appartenance d'un élément à une classe particulière dépend tou jours de l'appartenance de son environnement. Les éléments ne se défi nissent qu'en fonction de leur environnement. Ainsi donc, il se pourrait que le Millions de cette phrase ne soit pas le même mot que le Millions du titre. En linguistique descriptive, deux segments identiques du point de vue phonologique ne constituent un même morphème que s'ils figurent dans la même classe de morphèmes : il faudrait probablement considérer sun (soleil) et son (fils) comme le « même » morphème, au même titre que table (de bois) et table (de logarithmes); s'ils figurent dans des classes de morphèmes différentes, comme par exemple sea (mer) et see (voir), ils ne sont certainement pas le même morphème; et si nous voulons ne pas faire disparaître le rapport entre (a) table (une table) et (to) table (tabul er) nous devons distinguer des morphèmes classés et des morphèmes non classés, et dire que le morphème non classé table figure à la fois dans la classe N et dans la classe V. De la même façon, si nous rencontrons Mill ions deux fois, nous essayons de le considérer comme un « même » mor-
  • 19. 24 phème répété (donc de la même classe), et de considérer ainsi ses deux environnements comme équivalents. Mais il se peut que nous découvrions ensuite qu'on obtient une meilleure analyse du texte en ne considérant pas ces deux environnements comme équivalents (parce que le premier environnement est équivalent à une certaine séquence A dans le texte, tandis que le second est équivalent à une autre séquence B, qui n'est pas équivalente à A). Ainsi donc il se peut que nous ayons à considérer les deux occurrences de millions comme appartenant à deux classes diffé rentes. Nous verrons à la section 9 que c'est bien le cas ici. ReVenons-en à notre segmentation. La deuxième phrase du texte est PW, et la troisième PW. Nous essayons donc de segmenter notre texte en tranches successives contenant chacune exactement PW et pas plus. Ces tranches seront alors les rangées successives de notre tableau à double entrée. Il s'agira souvent d'une phrase entière, mais pas nécessairement : les différentes sections d'une phrase composée, chacune ayant sa propre structure de phrase (comme les deux E'T du paragraphe 5.3.), peuvent aussi constituer des tranches. Mais toute autre portion de la phrase peut aussi constituer une de ces tranches. Par exemple, si nous avions dans notre slogan la phrase : Millions of people — four out of five — can't be wrong when they say they prefer X, qui, telle qu'elle est là, paraît consis ter PPWW, nous essaierions de la réduire à deux segments PW. en Ces segmentations, moins évidentes, demandent la plus grande attention, car nous voulons non seulement que les occurrences de P et W soient les mêmes dans chaque segment, mais aussi que le rapport entre P et W soit le même. Quand, dans une suite de phrases, chaque phrase tout entière se réduit à PW,le rapport entre P et W dans chaque segment est le même; la linguistique descriptive nous apprend que c'est le rapport entre sujet et prédicat. Nous n'avons pas besoin d'utiliser ce renseignement spéci fique pour analyser notre texte en PW successifs, mais nous tenons pour acquis que, quel que soit le rapport entre P et W dans un segment, il est le même dans tous les autres segments. Sans quoi il serait faux de dire, en face d'un tableau à double entrée, comme les TE successifs du para graphe 5.4., que les segments successifs sont identiques pour ce qui est de T et E. Nous verrons aux paragraphes 7.2. et 7.3. les techniques permettant de vérifier que le rapport entre les classes d'équivalence de chaque rangée est le même. 6.3. Séries de segments semblables. On ne réussira généralement pas à diviser tout un texte en segments contenant les mêmes classes d'équivalence (dans le même rapport les unes par rapport aux autres). Il peut y avoir ici et là des phrases qui tout simplement ne contiennent pas ces classes : elles peuvent se révéler être des phrases d'introduction ou des ramifications d'une autre série de classes d'équivalence. Et le texte peut être constitué de morceaux suc cessifs, sortes de sous-textes à l'intérieur du texte principal, comme des
  • 20. 25 paragraphes ou des chapitres contenant chacun ses propres classes d'équi valence différentes de celles des autres morceaux. En cherchant les segments qui contiennent les mêmes classes, on découvrira les limites de cette appartenance à une même classe, c'est- à-dire les endroits où l'on obtient des fragments du texte contenant des classes différentes. En règle générale un texte ne se réduira donc pas à une seule série de rangées identiques (chaque rangée, comme TE, repré sentant un fragment contenant les mêmes classes d'équivalence), mais à une succession de séries de rangées identiques à l'intérieur de chaque série avec, ici et là, des rangées individuelles et différentes. Ayant obtenu ce résultat, nous comparons alors les différentes séries et rangées individuelles, pour voir leurs ressemblances et leurs différences en ce qui concerne l'agencement de leurs classes, que les classes spéci fiques soient différentes ou non. Nous essayons de découvrir des schemes dans l'occurrence de ces ressemblances au cours de la succession des séries et des rangées individuelles. Par exemple, supposons un texte de la forme AB TE TE TE A'B' EP EP AB KD LM LM K'D' MS MS MS FBV MS. Si nous utilisons des crochets pour représenter une série de fragments de la même forme en laissant momentanément BV de côté, nous pouvons alors représenter le texte par AB [TE] A'B' [EP] AB KD [LM] K'D' [MS]. Nous remarquons alors que AB [TE] A'B' [EP] et KD [LM] K'D' [MS] sont structurellement identiques : tous deux sont de la forme w [xy] w' [yz]; c'est un rapport particulier entre w, x, y et z; notre texte consiste en deux occurrences de cette structure, plus une deuxième apparition du w de la première occurrence (c'est-à-dire le AB) entre les deux structures (ou avant la seconde structure), et plus un FBV unique avant la fin de la dernière structure. 7. — Techniques auxiliaires. Il faut affiner et compléter la procédure centrale, que nous venons de voir, à l'aide de plusieurs techniques auxiliaires. 7.1. Occurrence indépendante. La distribution des classes d'équivalences (leur scheme d'occur rence)et la segmentation en fragments qui les contiennent, dépendent de ce que nous reconnaissons être une occurrence d'un élément. A première vue, cela peut paraître tout simple : dans la suite Say they prefer X- to any hair tonic they've used before, nous trouvons évidemment say une fois, they deux fois, etc., En y regardant de plus près cependant nous voyons que toutes les occurrences des éléments ne sont pas indépendantes : cer tains éléments ne se trouvent, dans un environnement donné, qu'en pré sence d'un autre élément. Cette situation est connue en linguistique des criptive; par exemple le 5- de he walks n'est pas pris comme élément indépendant, mais comme une co-occurrence automatique de he, par
  • 21. 26 comparaison avec / walk, you walk 10; et dans des formes comme both he and I, la présence de both entraîne toujours celle de and, si bien qu'on peut considérer both ... and comme un seul élément — et non comme deux éléments. De la même façon, si dans un texte nous trouvons des éléments identiques (répétés) ou différents, dont l'un n'apparaît que si l'autre est présent, nous concluons que ces occurrences ne sont pas indé pendantes l'une de l'autre et nous indiquons leur occurrence combinée comme un seul élément dans notre représentation du texte. Pour they prefer X- to any hair tonic they've used nous ne pouvons le comparer qu'à you too and your whole family will prefer X- to any hair tonic you've used. Dans les deux cas, ce qui vient avant prefer contient le mot qui précède 've; nous pouvons donc dire que le mot qui précède 've n'est pas indépendant ou, plutôt, que le choix de l'un des deux membres du groupe they /you dépend de celui des deux mots de ce groupe qui se trouve devant prefer. Si le signe Q représente la répétition du membre du groupe they /you qui se trouve dans ce qui précède prefer, on a : U X J I J X XX they prefer X- to any hair tonic Q've used You... will prefer X- to any hair tonic Q've used. Maintenant que nous avons réduit ces énoncés à leurs éléments indépendants, nous constatons que leurs dernières parties sont devenues identiques; par conséquent les premières parties des deux phrases se trouvent dans des environnements identiques, elles sont donc équival entes; puisque la première appartenait à la classe P, la seconde you too... appartient aussi à P u. Ceci était un type d'occurrence liée; il y en a bien d'autres sortes qu'il faut étudier; et les enseignements tirés de cette étude sont utiles à la fois pour l'analyse du discours et pour une linguistique descriptive plus détaillée. Les pronoms en offrent un exemple important. Si le slogan avait dit you... will prefer it, au lieu de you... will prefer X-, nous commencerions par considérer it comme un nouvel élément, à placer dans une nouvelle classe d'équivalence. Mais, en fait, l'occurrence de it dépend de l'occur rencede X- : si le X précédent avait contenu le morphème de pluriel (X-s), le pronom dans cette phrase aurait été them. D'autres mots du groupe de it, comme he ou you, ne peuvent figurer tant que X- apparaît dans la phrase précédente. Il en est de même pour des mots comme 10. Le s fait aussi partie de tous les noms singuliers (The child walk-s, etc.). Ou on peut également considérer que walks, goes, etc., sont des variantes de walk, go, etc. après he et les noms singuliers. 11. Avant d'en venir là, il faut effectuer un certain nombre d'autres opérations pour réduire Four out of fives... say they prefer... à deux séquences PW : Four... say... et they prefer..., la phrase You... will prefer... étant une troisième séquence PW. Sinon, les mots say they resteraient, puisque la séquence P (équivalente à millions) est seulement Four out of five people in a nation wide survey, et puisque la séquence W corrigée (identique au W de You... will prefer) est seulement prefer X- to any hair tonic Q've used (cf. para graphe 9).
  • 22. 27 this /these, who /which, qui dépendent eux aussi de mots particuliers appa raissant à un autre endroit du texte. Sans faire appel à aucune connais sance sur la signification de ces pronoms ou sur leur « référence » aux noms qui les précèdent, nous pouvons conclure, d'après leur distribution dans le texte, que ce ne sont pas des éléments indépendants : ils contiennent une partie (discontinue) de l'occurrence du morphème auquel ils sont correliés. On rencontre un autre type d'occurrence liée dans des expressions réciproques comme each other et together qui introduisent dans la langue certaines des fonctions remplies par les variables dans les expressions mathématiques — mais avec ce manque de netteté et cette complexité qui sont caractéristiques de la langue. La phrase Foster and Lorch saw each other at the same moment est normale; mais enlevez and Lorch, et tous les anglophones remplaceront immédiatement each other par autre chose. Autrement dit, nous ne trouvons pas de phrase qui contienne each other sans contenir soit l'expression and Z, soit un morphème de pluriel dans le nom correspondant. Et aussi bien nous trouverons la phrase Electrons and positrons attract each other, mais nous ne trouverons pas — dans un livre de physique tout au moins — la même phrase avec omission de and positrons, sauf s'il y a aussi d'autres modifications telles que le remplacement de attract par repel. On peut remarquer que les éléments dépendants ont particulièrement tendance à appartenir, dans leurs différentes occurrences, à des classes d'équivalence différentes, puisque chaque occurrence appartient à la classe de l'élément, quel qu'il soit, qui lui est correlié. Si le texte disait : You will prefer X-, You will prefer it, The survey showed, It showed, la première occurrence de it appartiendrait à la classe de X-, la seconde à la classe de survey. Dans tous ces cas, on peut éliminer les rapports spéciaux d'occur rence liée entre des éléments particuliers, en faisant simplement de l'él ément dépendant une partie de l'élément auquel il est correlié (dont son occurrence dépend). Il est bien entendu que, quand nous parlons de dépendance, l'application que nous en faisons est restreinte au texte particulier considéré. Il se peut que l'interdépendance entre les pronoms, ou les mots réciproques, et un quelconque nom voisin se maintienne dans tous les textes où ces mots apparaissent; mais l'interdépendance entre les deux occurrences de they ou de you dans notre texte est spécifique à ce texte; on pourrait trouver ailleurs la phrase they prefer X- to any hair tonic you've used; mais dans ce texte particulier, nous n'avons pas cette phrase. C'est pourquoi dans ce texte nous pouvons dire ce que le second pronom doit être, en considérant le premier. 7.2. Subdivisions des phrases. La présence d'éléments dépendants nous conduit à considérer diff éremment la subdivision des phrases.
  • 23. 28 Quand les parties dépendantes d'un élément sont dispersées sur toute une zone, nous devons généralement considérer toute cette zone comme constituant un seul fragment comportant cet élément. Dans they prefer X- to any hair tonic they've used par exemple, nous avons mont ré que les deux occurrences de they sont interdépendantes dans ce texte; nous pouvons donc décomposer cet énoncé en they (se présentant dans les deux positions) plus... prefer X- to any hair tonic... 've used; de même pour la phrase avec you (également dans les deux positions). Il s'agit là d'un traitement plus général que celui du paragraphe 7.1., qui donnait un statut privilégié à la première occurrence de they et de you en en fai sant dépendre la seconde occurrence, et qui fondait l'identité des deux phrases dans leur dernière partie sur le fait que toutes deux renfermaient le même type de dépendance (Q). Ce nouveau traitement élimine la dépendance en considérant que l'unique they ou you figure dans les deux positions, et établit sans conditions l'identité des secondes parties des phrases. Le résultat de ce nouveau traitement est que, puisque le they à double position s'étend sur presque toute la longueur de la seconde partie, toute cette seconde partie doit être enfermée dans le même frag ment que they. L'unification des deux occurrences de they nous empêche donc de faire là deux segments; sinon nous aurions pu avoir deux seg ments : they prefer... et soit they've used soit Q've used. D'un autre côté, il y a des cas où la dépendance nous conduit à dis tinguer plus de segments que nous ne le ferions autrement. Prenons par exemple la phrase Casals, who is self-exiled from Spain, stopped performing after the fascist victory. Si nous étudions le texte dans lequel est enchâssé cet énoncé, nous trouvons que le who est dépendant de Casais, tout comme le second they est dépendant du premier : le texte contient And the same Casals who... mais plus loin The records which... Nous pouvons donc dire que le who « contient » Casals, c'est-à-dire qu'il en est soit la continuation, soit la répétition. Mais laquelle des deux est-il? S'il en est la continuation, nous n'avons qu'un segment, la première partie (C) étant Casals who, la seconde (S) étant is self exiled... stopped... S'il en est la répétition, nous avons deux segments, l'un enchâssé dans l'autre : le premier est constitué de Casais (C de nouveau), plus stopped performing (Sx), le second de who (considéré comme équivalent de Casals) plus is self-exiled (S2). Nous n'opterions pour la seconde solution que si nous pouvions montrer, en fonction du texte, que is self-exited... et stopped performing... sont deux éléments distincts (et non simplement deux parties d'un même long él ément) — si, par exemple, nous trouvions dans le texte deux autres phrases : The press failed to say why he stopped performing, etc. But he has stated publicly why he is self-exiled, etc. Dans tous les cas, who contient Casals. Mais si la phrase originelle est Casals who S, notre analyse donne CS, tandis que si (à la lumière des deux dernières phrases) nous considé ronsphrase originelle comme étant Casals who S2SV notre analyse donne la CC S2 Sv et divise la phrase en deux segments CS2 et CSj, le résultat
  • 24. 29 étant que S2 et Sx sont équivalents puisqu'ils apparaissent tous deux après C. La seule différence qu'il y a entre le fait déconsidérer un élément dépendant comme une continuation et le fait de le considérer comme une répétition réside dans le nombre de segments — un ou deux — en lequel nous pouvons alors décomposer le tout. Nous venons de voir que, quand une phrase contient un élément A, qui est dépendant de B, nous pouvons soit considérer toute la phrase comme un seul segment dans lequel A est simplement une continuation de B, soit la considérer comme deux segments, l'un contenant B et l'autre contenant A dans la même classe que B. En règle générale, on optera plutôt pour cette seconde solution si le reste de la phrase peut se diviser en deux parties comparables, l'une allant avec A et l'autre avec B. Des choix de ce type peuvent se présenter même là où il n'y a pas de formes dépendantes. Par exemple, dans notre second texte, nous avons ensuite la phrase The self-exiled Casals is waiting across the Pyrenees for the fall of Franco; nous souhaitons mettre self-exiled dans la même classe que is self-exiled..., puisqu'ils comportent les mêmes morphèmes (à condition de pouvoir montrer d'après le texte lui-même que self-exiled est équivalent à self-exiled from Spain); ceci nous donne la structure de phrase particulière S2 C S3, par comparaison avec les phrases CS précé dentes. Si maintenant par un heureux hasard le texte contenait également la phrase Casals is waiting across the Pyrenees for the fall of Franco (ce qui est trop demander en fait de répétition), nous serions à même de faire l'analyse suivante : nous avons comme phrases du texte : CS1} C is S2, S2CS3, CS3; les séquences S1} S2 et S3 sont toutes membres d'une même classe d'équivalence S, puisqu'elles apparaissent toutes après C. La diff iculté vient de cet étrange objet qu'est S2CS3. Disons maintenant que toute phrase XjAX2 peut être « transformée » en A is Xj : AX2 12; ceci signifie que, si XjAXg se trouve dans le texte, alors A is Xx : AX3 s'y trouve aussi; dans ce cas, nous considérons XXAX2 comme équivalent à A is Xx : AX2. Notre étrange objet S2CS3 disparaît alors : nous le rempla çons C is S2 et CS3, qui tous deux se retrouvent ailleurs dans le même texte. par On peut continuer dans cette voie jusqu'à des transformations qui ne sont pas déjà justifiées par le texte, pourvu qu'elles ne soient pas en contra diction avec lui. Par exemple, nous trouvons dans le texte les phrases The memorable concerts were recorded in Pardes... The concerts were recor dedfirst on tape. Nous pouvons écrire ceci MNRX : NR2 (l'équivalence de Rx et R2 est supposée démontrée à un autre endroit du texte), et nous transformerions la première phrase en N is M : NRr Nous ne prétendons pas par là que notre transformation N is M (The concerts were memorable) figure vraiment dans le texte, ou qu'il n'y ait pas de différence stylistique ou autre entre The memorable concerts were recorded in Prades et The 12. Dans les formules comme A is Xt : AX2, le : indique la fin d'une phrase ou d'un segment. (On l'utilise de préférence au point qui risquerait d'être confondu avec le point marquant les fins de phrase dans le texte de l'auteur.)
  • 25. 30 concerts were memorable : The concerts (ou They) were recorded in Prades. Tout ce que cette transformation signifie, c'est qu'on considère MNRj^ comme équivalent de N is M : NRj, parce qu'on trouve bien S2GS3 comme équivalent de C is S2 : CS3, en ce sens que tous deux figurent dans le texte modifié. D'une part nous avons éliminé de notre agencement en tableau la structure de segment spéciale MNRX ou S2CS3 — spéciale parce que les autres segments sont tous de la forme NR ou CS. D'autre part, nous avons découvert que M (ou plutôt is M) est membre de la classe R. Mais surtout nous avons établi qu'une phrase peut être représentée par deux segments même si elle ne contient pas deux ensembles des classes d'équi valence voulues. C'est ce qui arrive quand nous pouvons démontrer qu'une seule classe dans la phrase a ailleurs un rapport indépendant avec deux autres classes ou éléments. Cette classe est donc répétée une fois dans chaque segment; et chaque segment marque individuellement le rapport de cette classe avec l'une des deux autres 13. Ces difficultés dans la division en segments viennent des rapports que les classes d'équivalence entretiennent les unes avec les autres. Une phrase n'est pas simplement l'occurrence simultanée de différents mor phèmes ou séquences; ceux-ci sont généralement liés, les uns aux autres, par un rapport spécifique, qui peut s'exprimer par un ou plusieurs mor phèmes d'ordre : You wrote Paul et Paul wrote you ne diffèrent que par l'ordre des morphèmes. Si nous trouvons dans notre texte plusieurs seg ments de la forme CS, cela signifie que C est dans un rapport particulier avec S — celui de se présenter avec S, et devant lui. Puisque nous n'opé ronspas sur le sens, nous ne savons pas ce que c'est que ce rapport, mais nous prenons soin de représenter le même ordre de morphèmes dans la phrase par le même ordre de classes dans le segment. Quand maintenant nous trouvons S2CS3, nous ne savons pas quel est le rapport entre cet ordre et l'ordre CS, et nous ne pouvons faire aucune comparaison entre les deux phrases. Il faut donc réorganiser ce S2CS3 inconnu, pour qu'il contienne les mêmes classes dans le même ordre que d'autres segments — et, bien entendu, nous devons montrer que la forme remaniée est équi valente, pour ce texte, à la forme originale. Dans la plupart des cas, la seule façon d'y arriver est de diviser la phrase inconnue, au moyen de transformations comme celles que nous avons vues plus haut, en deux ou plusieurs segments, de façon à ce que les segments obtenus aient une forme qui se rencontre dans le texte. De cette manière, nous obtenons un grand nombre de segments de structure semblable, même dans un texte dont les phrases sont très différentes les unes des autres. 13. Nous avons considéré ici le cas important de la séquence adjectif + nom + verbe, dans laquelle le nom a des rapports indépendants avec l'adjectif et avec le verbe. On peut représenter l'adjectif, aussi bien que le verbe, comme prédicat du nom. Nous reviendrons sur cette question au paragraphe 7.3.
  • 26. 31 7.3. Transformations grammaticales. Nous avons vu jusqu'ici comment on peut étudier la structure d'un texte sans faire appel à aucune information qui ne soit pas fournie par le texte lui-même : la procédure directe consiste à dresser des classes d'équi valence et à découvrir des schemes de combinaison de ces classes dans les segments successifs du texte (c'est-à-dire à trouver des combinaisons semblables ou partiellement semblables). On obtient souvent cependant beaucoup de petites classes et de segments qui ne sont pas semblables, parce que les phrases sont si différentes les unes des autres; quand c'est le cas, on s'aperçoit qu'en comparant les phrases du texte on peut parfois montrer qu'une partie d'une phrase est équivalente (pour ce texte) à une partie différente d'une autre phrase et, par conséquent, qu'elle contient les mêmes classes. Ceci dépend du nombre de répétitions que contient le texte. Passons maintenant à la possibilité de pousser plus loin dans la même direction en faisant appel à une information extérieure au texte; celle-ci sera de la même nature que celle que nous avons cherché à établir à l'intérieur du texte, c'est-à-dire qu'elle conservera l'équivalence de parties de phrases (au sens où MNR est équivalent à N is M : NR); elle reviendra à la même opération fondamentale, c'est-à-dire à la comparaison de phrases différentes. Et elle tendra au même but : montrer que deux phrases, différentes par ailleurs, contiennent la même combinaison de classes d'équivalence, même si elles contiennent des combinaisons diff érentes de morphèmes. La seule nouveauté, c'est qu'au lieu de comparer deux phrases du texte, nous comparerons une phrase du texte à des phrases qui ne sont pas dans le texte. On pourrait penser qu'il s'agit là d'une différence capitale et s'inter rogersur la validité de l'application à notre texte d'une équivalence ainsi établie. Nous avons déjà répondu à cette objection au paragraphe 3 : si nous pouvons montrer que deux séquences sont équivalentes dans toutes les phrases anglaises où elles figurent, alors elles sont équivalentes dans tout texte écrit en anglais. Si dans toute phrase anglaise contenant XAY, le XAY est équivalent à A is X : AY, alors si nous trouvons S2CS3 dans notre texte anglais nous pouvons dire que S2CS3 équivalent à C is S2 : CS3. Mais qu'est-ce que Y équivalence? Deux éléments sont équivalents s'ils se trouvent dans le même environnement à l'intérieur de la phrase. Deux phrases d'un texte sont équivalentes simplement si elles se trouvent toutes deux dans ce texte (sauf si on découvre des détails de structure assez fins pour montrer que deux phrases ne sont équivalentes que si elles figurent dans des positions structurelles semblables dans ce texte). De même, deux phrases d'une langue sont équivalentes si elles se rencontrent toutes deux dans cette langue. En particulier, on dira que des phrases de la forme A sont équivalentes à des phrases de la forme B si, pour chaque phrase A, on peut trouver une phrase B contenant les mêmes morphèmes,
  • 27. 32 mises à part les différences dues à la différence de forme entre A et B : par exemple, I^VNa est équivalent à N2 is V-en by Nx parce que pour toute phrase comme Casals pldys the cello, on peut trouver une phrase The cello is played by Casals. Nous ne soutenons nullement que deux phrases équivalentes signi fient nécessairement la même chose, ni qu'elles soient pareilles du point de vue stylistique. Mais par contre nous soutenons que toutes les phrases ne sont pas ainsi équivalentes : la relation d'équivalence n'est pas sans intérêt, comme elle le serait si elle existait pour toutes les phrases. Par exemple, NjVN,} n'est pas équivalent à Nx is V-en by N2, parce que cette dernière forme se trouve pour certains N± et certains N2 (I saw you et / was seen by you), mais pas pour tout Nj^ et tout N2 (on ne trouve pas Casals is played by the cello) u. Nous affirmons de plus que l'application de cette équivalence grammaticale provenant de l'extérieur nous per mettra de découvrir dans notre texte des segments semblables supplément aires nous ne pourrions pas trouver par la simple comparaison des que phrases du texte. Ainsi, on peut démontrer que dans divers environne ments he, etc., sont grammaticalement équivalents aux noms qui les who, précèdent, et que Nx who Vx V2 est équivalent à NjVg : N^; dans Casais, who is self-exiled... stopped performing..., il y a deux segments CSX : G is S2; nous aboutirions à ce résultat (sans avoir à nous préoccuper de savoir si Casals who constitue une occurrence prolongée de C, ou deux occurrences répétées), même s'il n'y avait pas d'autre occurrence de who dans le texte, c'est-à-dire même si l'analyse était impossible à partir du seul texte. L'équivalence grammaticale nous est particulièrement utile si nous avons par exemple un grand nombre de segments contenant tous Casais, entremêlés avec beaucoup d'autres contenant he, et si nous ne pouvons trouver aucun environnement contextuel commun pour démont rer que Casais et he sont équivalents. Dès que nous acceptons cette équivalence grammaticale, nous pouvons montrer que tous les environne ments Casais sont équivalents à ceux de he; et ceci peut à son tour de nous permettre de découvrir d'autres équivalences à partir du texte. On peut explorer plus systématiquement l'équivalence grammaticale en introduisant une technique de variation expérimentale. Supposons que nous ayons une phrase d'une forme donnée A et que nous voulions une forme B; nous essayons de modifier A, le changement consistant un iquement en la différence formelle qui existe entre A et B, pour voir ce qui se passe alors en A. Supposons par exemple que nous ayons The memorable concerts were recorded... qui est de la forme MNR, et que nous voulions rendre la forme de cette phrase comparable à celle de segments précédents commençant par N; à cette fin, nous cherchons une variante 14. Il est vrai qu'on pourrait soutenir que cette dernière phrase est encore gramm aticale. Mais la grammaire actuelle ne fait pas de distinctions entre les divers membres d'une classe morphologique. Par conséquent, l'exigence que la phrase B contienne les mêmes morphèmes que la phrase A sort de la grammaire, au sens courant de ce terme.
  • 28. 33 de cette phrase qui commence par The concerts; on peut essayer de l'obtenir en plaçant un informateur dans une situation sociale authen tique productrice de parole (et non un exposé linguistique sur la parole), dans laquelle il énoncerait une phrase commençant par The concerts et contenant les mots memorable et recorded 15. Ou bien on peut y arriver par le travail fastidieux de l'observation, en cherchant une phrase qui commence par The concerts et contienne memorable et recorded. Par l'une ou l'autre de ces deux méthodes, nous pourrions obtenir The concerts were memorable and were recorded, ou quelque chose d'approchant 16, qui montrerait que quand M (ou tout autre adjectif) passe de l'autre côté de N (le nom qui le suit), on insère is; MN est équivalent à N is M. Nous découvrons ainsi que, quand MNR passe à une forme qui commence par N, un is apparaît entre N et le M qui le suit. Cette technique consistant à faire varier la forme grammaticale d'une phrase, tout en gardant constants ses morphèmes ne peut pas s'ap pliquer à l'intérieur d'un texte; car là, tout ce que nous pouvons faire, c'est étudier le matériau qui nous est donné. Mais on peut l'utiliser pour la langue, hors du texte, car nous avons le droit, en tant que locuteurs, de créer une situation sociale qui pourrait amener un autre locuteur à prononcer telle phrase plutôt que telle autre parmi toutes les phrases dont il dispose. Cette technique est particulièrement utile avec une langue comme l'anglais, où tant de morphèmes figurent dans diverses classes grammaticales. Le paragraphe précédent montre la précaution essentielle que nous devons prendre quand nous appliquons l'équivalence grammaticale pour étoffer les classes d'équivalence contextuelle : nous ne nous posons pas simplement la question : Quelles formes de phrase sont équivalentes à MNR? Il peut y en avoir beaucoup. La question que nous nous posons est : Puisque N... est une forme commune dans ce texte, et puisque nous y trouvons aussi MNR, peut-on remplacer cette dernière forme par une phrase équivalente de la forme N...? Le sens du changement à opérer n'est pas arbitraire mais vient entièrement du texte. Comme précédem ment, revient à diviser les phrases en des segments aussi semblables cela que possible. Tout ce que nous nous demandons, c'est s'il existe une équi valence grammaticale qui relie MNR à la forme N...; la réponse est oui, pourvu qu'un is figure dans la forme N...; ce qui à son tour fait de is M 15. Pour donner un exemple très simple, on peut lire en compagnie de l'informateur la phrase du texte The memorable concerts were recorded, puis s'arrêter et lui dire de façon hésitante et interrogative « That is to say, the concerts » (c'est-à-dire, les concerts...) et attendre qu'il donne la suite. 16. Nous pouvons trouver beaucoup de phrases qui commencent par The concerts et qui contiennent les deux autres mots, par exemple The concerts were not memorable, but were neverthless recorded. Ces phrases contiendront divers mots en plus de ceux de la phrase originelle; mais le seul mot nouveau qui se trouvera dans toutes les phrases de la forme voulue NMR (ou plutôt dans une sous-classe des phrases NMR) sera une forme du verbe to be. C'est donc le seul mot nouveau qui soit indispensable quand on opère le changement pour obtenir cette forme.
  • 29. 34 un équivalent de R. Comme ailleurs en linguistique, il ne s'agit pas de donner à toutes les phrases n'importe quelle forme choisie arbitrair ement; méthode permet simplement de décrire les formes moins la fréquentes du texte (MNR) en fonction des formes fréquentes (N...). Pour l'analyse purement contextuelle, nous n'avons besoin de connaître que les limites des morphèmes. Pour utiliser les équivalences grammatic ales, devons également connaître la classe morphophonologique à nous laquelle chaque morphème de notre texte appartient, puisque les règles grammaticales concernent des classes plutôt que des morphèmes indivi duels. Dans le cas considéré, la règle grammaticale est : adjectif + noin est équivalent à nom + is + adjectif; pour pouvoir l'appliquer à notre séquence MN, nous devons savoir que le M est un adjectif et que le N est un nom. On a constaté empiriquement que le nombre d'équivalences grammat icales auxquelles on fait appel à chaque fois pour réduire des phrases d'un texte en des segments semblables, est relativement peu élevé. C'est pourquoi, même si on n'est pas linguiste, on peut apprendre beaucoup sur le texte en utilisant (en plus de la méthode d'analyse interne du texte) une liste préétablie des principales équivalences grammaticales pour la langue en question. Voici quelques-unes des équivalences qui sont fréquem ment utilisées (nous ne donnons aucune preuve de leur validité, et seul ement quelques indications très approximatives des environnements de phrase où elles s'appliquent) 17. 1) Si nous trouvons XCY, alors X = Y (X est équivalent à Y). Le C est une conjonction comme and, but, or, ou bien, dans certaines circons tances spéciales, un syntagme comme as well as, rather than, A-er than. X et Y doivent être dans la même classe grammaticale. Par exemple, dans I phoned him but he was out, X et Y sont tous deux de la forme NV; dans I saw it but went on, Y est seulement constitué par le syntagme verbal went on, X ne peut donc inclure que le syntagme verbal saw it (et non toute la séquence I saw if). Il s'ensuit que N^CN^ est équivalent à deux segments N^ : N2V2 et NV^V-j = NVX : NV2. 2) La séquence Nx is N2 indique que Nj_ = N2. La classe de is comprend remains et d'autres verbes. 3) Nj N2, avec un accent primaire sur chaque N, indique que Nx = N2; exemple : The pressure P increases est équivalent à The pressure increases et P increases. 4) NV (that) NV = NV : NV; exemple / telegraphed that we'll arrive to-morrow est équivalent à I telegraphed : we'll arrive to-morrow. 17. A = adjectif. N = nom, V = verbe, P = préposition. Les indices indiquent des morphèmes particuliers, sans tenir compte de leurs classes.
  • 30. 35 5) NjVK^ = NgV*^, V et V* étant respectivement actif et passif ou vice versa. 6) NjPNa = NaP*^; exemple : (they seek) the goal of certainty est équivalent à une certaine forme comme (they seek) certainty as a goat. Quand on inverse deux noms la modification des prépositions est bien plus grande que la modification correspondante des verbes : dans le cas des verbes, elle s'effectue simplement par l'addition ou le retrait du morphème de passif et du mot by; dans le cas des prépositions, il faut remplacer une forme par une forme entièrement différente. Les paires de prépositions équivalentes ne sont pas fixes : entre certains noms, le substitut de of peut être as; entre d'autres noms, il peut être with. Néanmoins il est pos sible de trouver des structures dans lesquelles les noms de la séquence N2 P N2 sont inversés. 7) Nj P N2 = Ag N1$ autrement dit, le morphème du second nom appar aîtsous une forme adjectivale avant le premier nom; exemple : training in médecine et medical training. 8) Des pronoms comme he, et certains mots commençant par wh- et th-, répètent un nom déjà énoncé. Quand ils sont précédés de plusieurs noms, quel nom répètent-ils? Cela dépend des détails de l'environnement grammatical; c'est généralement le nom qui les précède immédiatement, ou le dernier nom figurant dans un environnement grammatical comparable. Par exemple, who = the man dans The man who phoned left no name (N who Vx V2 = NV2 : NVj); who = my roommate dans The man spoke to my roommate, who told him to call again (N^Ng who V2 = N^Ng : N2 V2). Il y a de nombreux procédés pour déterminer quel est le nom qu'un pronom répète, et quel verbe va avec chaque nom. Dans the man who phoned, on ne peut pas insérer un sujet avant phoned, il faut donc prendre who comme sujet. Dans The man I phoned was out, nous réduisons d'abord en / phoned : The man was out; ensuite, puisqu'on ne peut pas insérer un complément d'objet après phoned dans la phrase originelle, nous faisons de the man le complément d'objet 18 de phoned et nous obtenons l'équiva lentphoned the man : The man was out ( : / 9) NV15 V2-ing = NVj_ : NV2; exemple : They escaped, saving nothing est équivalent à They escaped : They saved nothing. 10) NiClNLj VX = IS^VM, : NgVNj. Ici X représente une classe d'expressions réciproques comme each other; par exemple : The Giants and the Dodgers each beat the other twice est équivalent à The Giants beat the Dodgers twice : The D. beat the G. twice. L'équivalence est quelque peu différente pour les différents groupes de formes X. 18. La seule façon d'exprimer l'exclusion d'un complément d'objet uniquement en fonction de l'occurrence des éléments est de dire que l'objet figure déjà. Ce ne peut être I puisque / est le sujet de phoned, ce doit donc être l'autre N, the man.
  • 31. 36 11) ANV = N is A : NV, cf. l'exemple the self-exiled Casals... du para graphe 7.2. De même NVANj = NVNj who is A = NVNX : Nt is A; exemple : They read the interdicted books = They read the books which were interdicted — They read the books : The bocks were interdicted. 12) NjVKjPNg = NjVNa : N^VPNg; c'est-à-dire qu'on peut remplac er double complément d'objet par deux compléments d'objet dis un tincts dans deux segments qui répètent le sujet et le verbe; exemple : / bought it for you = I bought it : I bought for you. Ces équivalences grammaticales conservent les morphèmes et leurs rapports grammaticaux, mais sous une autre forme grammaticale. On ne peut avoir NjVNa = NgVNj, parce que cela modifierait le rapport sujet-objet avec le verbe; mais on peut avoir N2V*NX comme équivalent de NjVNa parce que là le verbe aussi est modifié de façon à ce que soit préservé son rapport grammatical avec les noms inversés. II est absolu mentessentiel de préserver les rapports grammaticaux, car ces rapports existent toujours entre les morphèmes d'une phrase. Autrement dit, il y a des restrictions de commutabilité d'ordre et d'intonation entre les diffé rents morphèmes (ou classes de morphèmes) d'une phrase et, quand nous passons d'une phrase à une phrase équivalente, nous voulons pouvoir retrouver les mêmes restrictions quand nous reviendrons à la phrase de base — puisque cette phrase de base, comme toute phrase, se définit par les restrictions qui lient ses différentes parties. Par conséquent, quand nous divisons une phrase en différents segments pour dresser un tableau, nous ne voulons pas que deux combinaisons des mêmes classes d'équivalence (par exemple les deux premières combinaisons TE ci-dessus) représentent des rapports grammaticaux différents. C'est pourquoi, quand nous trans formons une phrase qui contient certaines classes d'équivalence, nous prenons soin de conserver leurs rapports grammaticaux originels. Cependant, nous trouvons quelquefois des morceaux de phrase qui ne contiennent aucune de nos classes d'équivalence; autrement dit (dans le cas le plus simple), ils ne contiennent aucun matériau qui se retrouve ailleurs dans le texte. Le rapport grammatical entre les morceaux uniques et le reste de la phrase doit être conservé dans notre disposition en tableau, au même titre que celui des morceaux récurrents. Mais nous n'avons pas à nous préoccuper de conserver leur rapport quand leur position relative change, puisque nous n'avons pas de raison de changer leur position relative : c'est seulement les classes d'équivalences que nous voulons redisposer. Pour ce matériau non récurrent, nous voulons seulement connaître son rapport aux classes d'équivalence et indiquer ce rap port dans l'analyse. L'étude du texte seul ne suffira peut-être pas, mais nous pouvons y arriver en faisant appel aux données grammaticales ou à la variation expérimentale. Revenons par exemple aux séquences Casais, who is self-exiled from Spain et the self -exiled Casals... Si cette dernière orme est S2 C, la première est C, C is S2 from Spain; puisque from Spain
  • 32. 37 est unique, tout ce que nous voulons savoir, c'est où le mettre quand nous disposons nos classes d'équivalence, autrement dit, quel est son rapport à ces classes. La grammaire nous apprend que dans des phrases de la forme NV APN l'unité minimale, dont PN est un constituant immédiat, est APN et que ce APN peut être remplacé par A tout seul 19. Par conséquent, si le A se trouve être membre d'une de nos classes d'équivalence alors que le PN ne l'est pas, nous associons le PN à A dans sa colonne d'équivalence en écrivant APN au lieu de A tout seul comme membre de la classe. De façon plus générale, le matériau qui n'appartient à aucune classe d'équivalence, mais qui est lié grammaticalement à un membre d'une classe, est joint à ce membre pour former un membre élargi de la classe en ques tion; ainsi self-exiled from Spain est maintenant dans la même classe que seïf-exiled. Ceci se justifie par le fait que, puisque ce matériau ne se retrouve nulle part ailleurs dans le texte (ou ne s'y retrouve que dans le même rap port grammatical à la même classe d'équivalence), son seul effet, quand on représente le texte par ses classes d'équivalence spécifiques, est précis ément son rapport au membre spécifique auquel il est grammaticalement lié. On rencontre un cas particulier assez intéressant quand deux membres de la même classe d'équivalence constituent conjointement l'unité immé diatement supérieure de leur phrase (c'est-à-dire quand ils sont les consti tuants immédiats de cette unité), quand, par exemple, ces deux membres sont un adjectif suivi d'un nom, avec AN = N. Dans ce cas, nous pouvons considérer que ces membres constituent à eux deux un seul membre de leur classe commune et entrent tous deux dans un seul segment. Si nous les considérions comme deux occurrences de leur classe commune, il nous faudrait mettre chaque occurrence dans un segment distinct. Les données grammaticales sont particulièrement utiles quand il s'agit de reconnaître les particules conjonctives. Il est facile d'identifier ces morphèmes à partir de la grammaire formelle, tout à fait indépendam ment sens, mais il peut être difficile de les identifier dans l'ana de leur lysepurement contextuelle. Leur importance réside dans le fait que beau coup de phrases d'un texte peuvent contenir les mêmes classes, à part quelques mots non classés, souvent situés au début, dont la fonction gram maticale est de lier ou d'introduire les phrases, et qui n'entrent pas dans les classes spécifiques qui couvrent la phrase ou le segment. Dans notre disposition en tableau, nous mettrons ces éléments, en raison de leur posi tion grammaticale, dans une colonne spéciale au début. Nous pouvons même aller plus loin et mettre dans cette première colonne tout matériau qu'on ne peut faire entrer dans aucune des colonnes d'équivalence. Ce matériau conjonctif n'est pas toujours immédiatement évident; remar quons qu'on peut analyser beaucoup de phrases de la forme JVV that N1V1 comme constituées des classes d'équivalence N^, le NV that étant relégué dans la première colonne; par exemple dans la phrase We are proud 19. Sémantiquement, on dira que PN « modifie » le A.
  • 33. 38 that these concerts were recorded by our engineers, les membres connus des classes d'équivalence sont concerts et recorded; les mots qui les précèdent ne se retrouvent pas dans le texte et ne sont liés grammaticalement à aucun membre d'une classe; bien au contraire, du point de vue grammatical on peut les remplacer par des adverbes introductifs comme indeed, même si au sens purement grammatical ils sont en fait le sujet et le verbe princ ipaux de la phrase. En plus des rapports grammaticaux des classes grammaticales tout entières, on peut utiliser des informations concernant le rapport entre des morphèmes spécifiques ou des sous-classes grammaticales et les classes grammaticales; on peut par exemple établir que (dans certaines langues) les verbes intransitifs forment une sous-classe qui ne se trouve jamais accompagnée d'un objet et qui est équivalente à un verbe transitif accom pagné d'un objet. Dans un texte donné, cela peut nous permettre de mettre un verbe transitif et son objet dans la même classe qu'un verbe intransitif ayant une position comparable. Enfin un grand nombre d'équivalences détaillées s'appliquent à des morphèmes spécifiques. Les renseignements concernant ces équivalences ne nous sont pas fournis par la linguistique descriptive, qui traite géné ralement de classes entières, mais on peut les obtenir par des méthodes linguistiques puisqu'ils concernent des occurrences couplées et des restric tions spéciales — bien que dans la plupart des cas il soit nécessaire d'étu dier ces restrictions en considérant plus d'une phrase à la fois. Supposons, par exemple, que nous trouvions les mots buy et sell dans un texte. Leurs environnsments dans ce texte peuvent ne pas se ressembler assez pour nous permettre de les ranger dans la même classe d'équivalence, en dépit des avantages que cela pourrait avoir pour l'analyse. Mais si nous examinons un certain nombre d'autres textes assez courts où ces deux mots figurent, nous constaterons qu'ils apparaissent souvent dans des environnements qui se correspondent et que, à certains égards, ce sont des inverses distribu- tionnels; autrement dit, nous trouvons de nombreuses phrases comme N-t buys from N2 : N2 sells to Nt (I bought it from him at the best price I could get, but he still sold it to me with a profit). Si les environnements de buy et sell dans notre texte sont semblables aux environnements couplés des autres textes, nous pourrons quand même, en considération de ces résul tatsplus généraux, mettre les deux mots dans la même classe d'équival ence, même les analyser comme étant inverses l'un de l'autre. ou De cette façon on peut mettre dans une même classe contextuelle plus de mots qu'il ne serait possible autrement, et on peut faire usage de ce qui paraît être des liaisons sémantiques spéciales entre des mots (comme entre buy et sell ou même entre un verbe transitif et la présence d'un complément d'objet), sans sortir du cadre d'une étude purement formelle des occurrences. La raison en est qu'il y a un haut degré de corrélation entre les différences de sens et les différences de distribution linguistique; et si, dans les limites d'un texte, on ne peut pas montrer les similitudes