SlideShare ist ein Scribd-Unternehmen logo
1 von 100
L’Econométrie des Données de
          Panel
       Modèles Linéaires
          Simples
L’Econométrie des Données de Panel                                                     2




                                      Figure 0.1:




Présentation


    Le but de ce séminaire est de proposer une initiation, tant sur le plan théorique
que sur le plan appliqué, à l’économétrie des données de panel. Sur le plan théorique,
le séminaire débutera par une présentation des problèmes de spéci…cations de base en
économétrie de panel et par les méthodes d’estimation traditionnelles. Cette première
partie insistera en particulier sur les stratégies de tests de spéci…cation du modèle. La
seconde partie du séminaire sera consacrée à l’étude des panels dynamiques et pro-
posera une introduction aux concepts de non stationnarité stochastique en panel
et notamment à la spéci…cation des tests de non stationnarité et de cointégration.
Ces concepts théoriques seront appliqués à di¤érentes problématiques économiques,
comme par exemple la problématique de la convergence des PIB par tête, que ce soit au
travers de commentaires de travaux empiriques ou par la programmation d’exemples
illustratifs sous un logiciel d’économétrie (TSP ou SAS à préciser)
L’Econométrie des Données de Panel                                                3




Table des Matières

    Introduction                                                            2

    Chapitre 1 : Modèles Linéaires Simples                                  5
    Introduction                                                            6

    1. Tests de spéci…cation ou tests d’homogénéité                         8
        1.1. L’exemple d’une fonction de production                         8
        1.2. Procédure de tests de spéci…cation                             10
             1.2.1. Procédure générale                                      10
             1.2.2. Construction des statistiques de test                   13
        1.3. Application                                                    17
    2. Modèles à e¤ets individuels                                          20
        2.1. Empilement par pays                                            21
             2.1.1. Exemple                                                 22
        2.2. Empilement par dates                                           23
             2.2.1. Exemple                                                 23
    3. Modèles à e¤ets …xes                                                 25
        3.1. Estimateur Within ou LSDV                                      26
        3.2. Application                                                    28
        3.3. Ecriture vectorielle                                           31
    4. Modèles à e¤ets aléatoires                                           33
        4.1. Modèle à variance composée                                     34
        4.2. Estimateurs du modèle à e¤ets aléatoires                       35
        4.3. Estimateur des Moindres Carrés Généralisés                     37
        4.4. Application                                                    42
    5. Tests de spéci…cation des e¤ets individuels                           44
        5.1. Corrélation des e¤ets individuels et des variables explicatives 45
        5.2. Test de spéci…cation d’Hausman                                  49
        6.3. Application                                                     51
    6. Modèles à coe¢cients …xes et aléatoires                              53
        6.1. Modèle MFR de Hsiao (1989)                                     53
        6.2. Méthode d’estimation des paramètres                            56
        6.3. Application                                                    57
L’Econométrie des Données de Panel                                        4



    Annexes                                                          62
       A.1. Equivalence entre les estimateurs Within et pooled à = 1 62
       :
       A.2. Programme TSP : Modèle MFR                               63
    Bibliographie                                                   67
L’Econométrie des Données de Panel          5




                              Chapitre I

                        Modèles Linéaires
                           Simples
L’Econométrie des Données de Panel                                                     6




Introduction

Dans ce premier chapitre, nous nous restreindrons à l’étude des modèles linéaires sim-
ples sur données de panel, ces derniers étant dé…nis par opposition aux modèles dy-
namiques faisant intervenir des variables endogènes retardées. Dans toute la suite de
ce chapitre, on considère des processus strictement stationnaires au sens de la
stationnarité du second ordre1 .

    L’objectif des cinq premières sections de ce chapitre est de faire en sorte que
le lecteur puisse interpréter, de façon exhaustive et relativement approfondie, les
résultats de base que donnent les principaux logiciels d’économétrie lorsque l’on
envisage des modèles de panel. Nous prendrons ici comme référence le logiciel TSP
4.3, mais il est bien entendu évident que ces résultats de base sont sensiblement
identiques si l’on considère d’autres logiciels comme Eviews, SAS ou Rats.
    Quelles sont les connaissances minimales nécessaires à l’économètre appliqué pour
pouvoir interpréter un tableau de résultats d’estimation de panel ? Prenons
comme exemple la commande panel de TSP. A l’issue de cette procédure, l’utilisateur
dispose des réalisations des estimateurs Pooled, Between, des estimateurs du modèle
à e¤ets individuels …xes (Within ), du modèle à e¤ets individuels aléatoires (Error
Component Model ), des résultats de trois tests de Fischer, d’un estimateur de la
variance des e¤ets individuels, d’un estimateur de la variance totale, de l’estimateur
d’un paramètre de pondération et de la statistique du test d’Hausman. Voilà ainsi
résumés tous les élements que nous nous proposons d’étudier tout au long des cinq
premières sections.

    Ainsi, la première       section est consacrée aux tests de spéci…cation qui
correspondent en fait aux trois tests de Fischer du …chier de résultat des estimations
TSP. Il s’agit ici de déterminer la manière dont doit être spéci…é un modèle de panel, si
tant que l’hypothèse de panel puisse être acceptée.                            Nous
verrons alors que toute l’analyse repose alors sur la notion d’homogénéité des
paramètres du modèle envisagé.          Les tests présentés visent ainsi à porter un
diagnostic sur l’éventuelle nécessité d’intégrer une dimension hétérogène et sur la
manière dont cette hétérogénéité doit être spéci…ée.                           Une des
manières simples pour ne pas supposer l’existence d’un modèle totalement
identique consiste ainsi à introduire des e¤ets individuels sous la forme de constantes
spéci…ques, propres à chaque individu du panel. Nous proposerons ainsi une procédure
générale de tests de spéci…cation des modèles linéaires simples.
  1
      La dé…nition de la stationnarité fera l’ob jet du chapitre suivant.
L’Econométrie des Données de Panel                                                   7



   Dans une seconde section, nous présenterons le modèle à e¤ets individuels. Ce
modèle suppose l’existence de coe¢cients identiques pour tous les individus et de con-
stantes spéci…ques. Ainsi, la relation économique mise en évidence à travers ce type
de modélisation n’est censée di¤érer pour tous les individus qu’au niveau des
constantes introduites dans le modèle. Nous insisterons alors sur la construction du
modèle et en particulier sur sa représentation sous forme vectorielle. Il s’agit ici de
présenter les deux principales méthodes de construction des échantillons de données, à
savoir la méthode d’empilement par date et la méthode d’empilement par individus.

   La troisième section est consacré au modèle à e¤ets individuels …xes. On suppose
dans cette section que les e¤ets individuels sont des paramètres déterministes.
Nous serons alors amener à présenter la construction et les propriétés de l’estimateur
Within des coe¢cients du modèle. Une application sur les relations entre le nombre
de grèves dans le secteur industriel et les déterminants macroéconomiques sera
proposée. Nous nous appuierons sur les résultats et les di¤érents tests proposés sous
TSP.

    Une quatrième section sera consacrée au modèle à e¤ets individuels aléatoires. On
suppose dans cette section que les e¤ets individuels ne sont plus des paramètres, mais
des variables aléatoires possédant une distribution commune pour tous les
individus. Nous commencerons par étudier la structure des résidus de ce modèle à
variance com- posée. Nous étudierons ensuite les di¤érents estimateurs des coe
¢cients du modèle à e¤ets aléatoires et plus particulièrement l’estimateur des
Moindres Carrés Généralisés.

    En…n, la cinquième section sera consacrée aux tests de spéci…cation des e¤ets indi-
viduels. La question est alors de savoir quel modèle, parmi les modèles à e¤ets
aléatoires et e¤ets …xes, doit être retenu. Ceci nous conduira à présenter le test
d’Hausman (1978) qui constitue le test standard de spéci…cation des e¤ets individuels.

   Nous conclurons en…n en introduisant un sixième section consacrée à la présentation
d’un type de modèle de plus en plus utilisé en économétrie appliqué : le modèle avec
coe¢cients …xes et coe¢cients aléatoires. Ce modèle, introduit notamment par
Hsiao (1989), permet de réaliser di¤érents exercices de modélisation économique
particulière- ment intéressants.
L’Econométrie des Données de Panel                                                         8




1.   Tests    de           spéci…cation             ou        tests
d’homogénéité

Lorsque l’on considère un échantillon de données de panel, la toute première chose qu’il
convient de véri…er est la spéci…cation homogène ou hétérogène du processus
générateur de données. Sur le plan économétrique, cela revient à tester l’égalité des
coe¢cients du modèle étudié dans la dimension individuelle.                Sur le plan
économique, les tests de spéci…cation reviennent à déterminer si l’on est en droit de
supposer que le modèle théorique étudié est parfaitement identique pour tous les pays,
ou au contraire s’il existe des spéci…cités propres à chaque pays.
    Nous commencerons par présenter un petit exemple illustratif construit à partir
d’une fonction de production agrégée. Dans une seconde section, nous généraliserons
la procédure de tests de spéci…cation en introduisant les notions de variances
intra- classes (Within ) et inter-classes (Between ). En…n, nous proposerons une
application de ces tests de spéci…cation à l’estimation d’une relation entre le nombre
de grèves et un ensemble de variables explicatives.

1.1. L’exemple d’une fonction de production

Prenons l’exemple d’une fonction de production.      Supposons que l’on dispose
d’un échantillon de données de P I B et de facteurs (travail et capital) sur une
durée de T périodes pour un ensemble de N pays. Si l’on note yi;t le logarithme du
P I B, ki;t le logarithme du stock de capital privé et ni;t le logarithme de l’emploi et
que l’on suppose une fonction de production de type Cobb Douglass, le modèle
général s’écrit sous la forme 8 i 2 [1; N ] ; 8 t 2 [1; T ] :

                              yi;t = ®i + ¯ i ki;t + ° i ni;t + "i;t

Les innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance égale
à
¾ 2 ; 8 i 2 [1; N ] :
  "


    Dans un premier temps, la phase de test de spéci…cation, revient sur le plan
économique, à déterminer s’il est en droit de supposer une fonction de production
totalement identique pour tous les pays (modèle pooled ). Dans ce cas, les élasticités
de l’emploi et du capital sont identiques pour tous les pays (¯ i = ¯; ° i = °; 8 i 2 [1; N ]
) et
le niveau moyen de la productivité totale des facteurs, représenté ici par les
constantes
®i ; est lui aussi identique pour tous les pays. Le modèle s’écrit alors sous la forme :

                               yi;t = ® + ¯ki;t + °ni;t + "i;t
L’Econométrie des Données de Panel                                                         9


    Toutefois, lorsque l’on travaille sur des séries agrégés, il est relativement peu prob-
able que la fonction de production macroéconomique soit strictement identique
pour tous les pays étudiés. Si l’hypothèse d’homogénéité totale est rejetée, il convient
alors de tester si les élasticités des di¤érents facteurs sont identiques. Si ce n’est pas le
cas, il n’existe a priori aucune structure de production commune entre les pays. Dans
ce cas, l’utilisation des données de panel ne se justi…e pas et peut même conduire à
des biais d’estimation. On doit donc estimer les fonctions de production pays par
pays.

    Si en revanche, il s’avère qu’il existe bien une relation identique entre la
production et les facteurs pour tous les pays, la source d’hétérogénéité du modèle peut
alors provenir des constantes ®i : Dans notre exemple, ces constantes représentent la
moyenne de la productivité totale des facteurs de production (résidu de Solow). Or,
rien ne garan- tit que les pays étudiés possèdent le même niveau de productivité
structurelle. Au contraire, il se peut parfaitement que des facteurs a-temporels ou
structurels, comme la position géographique, le climat, l’éloignement par rapport au
grands axes commerciaux etc... aient pu conduire à des di¤érences structurelles de
niveau de productivité entre les pays. Il convient donc de tester l’hypothèse d’une
constante commune à tous les pays. Si cette hypothèse est rejetée, on obtient alors
un modèle avec e¤ets individuels qui s’écrit sous la forme :

                              yi;t = ®i + ¯ki;t + °ni;t + "i;t

   Dans ce cas, le niveau moyen de la productivité totale des facteurs, déterminé par
E (®i + "i;t ) = ®i ; varie selon les pays, même si la structure de production (les
élasticités des deux facteurs travail et capital) est identique.

    Cet exemple, que nous allons à présent généraliser, montre bien que la phase de
test de spéci…cation revient à déterminer si le processus générateur de données
peut être considéré comme homogène, c’est à dire unique pour tous les individus, ou
si au contraire il apparaît totalement hétérogène, auquel cas l’utilisation des
techniques de panel ne peut se justi…er. Entre ces deux cas extrêmes, il convient
de précisément identi…er la source d’hétérogénéité pour bien spéci…er le modèle.
L’Econométrie des Données de Panel                                                                      10


1.2. Procédure de tests de spéci…cation

On considère un échantillon de T observations de N processus individuels fyi;t ; t 2 Z; i 2
Ng et fxi;t ; t 2 Z; i 2 Ng : Par la suite, on notera fyi;t g et fxi;t g ces deux processus.
On suppose que le processus fyi;t g est dé…ni de façon générale par le relation linéaire suiv-
ante, 8 i 2 N, 8 t 2 Z :
                                     yi;t = ®i + ¯i0 xi;t + "i;t                       (1.1)
                    ¡                 ¢
                                        0
où ®i 2 R, ¯ i = ¯ 1;i ¯ 2;i ::::¯ K;i est un vecteur de dimension (K; 1). On
considère ainsi un vecteur de K variables explicatives :
                                                                                 0
                                       xi;t = (x1;i;t ; x2;i;t ; :::; xK;i;t )                       (1.2)

         Les innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance

         égale
     2
à   ¾" ;   8 i 2 [1; N ] : Ainsi on suppose que les paramètres ®i et ¯ i du modèle (1.1) peuvent

di¤érer dans la dimension individuelle2 , mais l’on suppose qu’ils sont constants dans le
temps.

1.2.1. Procédure générale

Si l’on considère le modèle (1.1), plusieurs con…gurations sont alors possibles :

     1. Les N constantes ®i et les N vecteurs de paramètres ¯ i sont identiques : ®i = ®;
           ¯ i = ¯ 8 i 2 [1; N ]. On quali…e alors le panel de panel homogène.

     2. Les N constantes ®i et les N vecteurs de paramètres ¯ i sont di¤érents selon
        les individus. On a donc N modèles di¤érents, on rejette la structure de panel.

     3. Les N constantes ®i sont identiques, ®i = ® 8 i 2 [1; N ] ; tandis que les
        vecteurs de paramètres ¯ i di¤èrent selon les individus. Dans ce cas, tous les
           coe¢cients du modèle, à l’exception des constantes, sont di¤érents selon les
           individus. On a donc N modèles di¤érents.

     4. Les N vecteurs de paramètres ¯ i sont identiques, ¯ i = ¯ 8 i 2 [1; N ] ;
           tandis que les constantes ®i di¤èrent selon les individus. On obtient un modèle
           à e¤ets individuels.

    Pour discriminer ces di¤érentes con…gurations et pour s’assurer du bien fondé de la
structure de panel, il convient d’adopter une procédure de tests d’homogénéité
emboîtés. La procédure générale de test présentée dans Hsiao (1986) est décrite sur la …
gure (1.1).
     2
         A l’exception de la variance des innovations que l’on supposera identique pour tous les individus.
Figure 1.1: Procédure Générale de Tests d’Homogénéité

                                                                                          1
                                                                                 TestH 0 :              i           i       i   1, N


                                                                 1
                                                            H        0
                                                                         rejetée                                                 H
                                                                                                                                     1
                                                                                                                                            vraie
                                                                                                                                     0




                                                      2
                                            TestH 0 :            i               i 1,                                              yi,t            ' xi,t      i,t

                                                                                 N              0




                          2
                      H       0
                                  rejetée                                                 H
                                                                                                    2
                                                                                                            vraie




                                                                                                    3
               yi,t       i        i   ' xi,t   i,t
                                                                                     TestH :                            i   1, N
                                                                                                    0        i


                                                                         3
                                                                     H       0
                                                                                 vraie                                           H
                                                                                                                                      3
                                                                                                                                            rejetée
                                                                                                                                     0




                                                          yi,t                   ' xi,t       i,t                                    yi,t      i      ' xi,t         i,t




   Dans une première étape, on teste l’hypothèse d’une structure parfaitement ho-
mogène (constantes et coe¢cients identiques) :
                                                        1
                                                      H 0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N ]

                                              1
                                            H a : 9 (i; j) 2 [1; N ] = ¯ i = ¯ j ou ®i = ®j
      On utilise alors une statistique de Fischer pour tester ces (K + 1) (N ¡ 1)
restric- tions linéaires3 . Si l’on suppose que les résidus "i;t sont indépendamment
distribués dans les dimensions i et t; suivant une loi normale d’espérance nulle et
de variance
…nie ¾"2 ; cette statistique suit une distribution de Fischer avec (K + 1) (N ¡ 1)
et N T ¡ N (K + 1) degrés de liberté. Les conclusions de ce test sont les
                                                                                                                        0
suivantes. Si l’on accepte l’hypothèse nulle H
                               1                                                                                            d’homogénéité, on obtient alors un
modèle de pooled
totalement homogène.
                                                                             yi;t = ® + ¯ 0 xi;t + "i;t                                                                    (1.3)

   Si en revanche, on rejette l’hypothèse nulle, on passe à une seconde étape qui consiste
à déterminer si l’hétérogénéité provient des coe¢cients ¯ i .

  3
      Dans notre modèle, chaque vecteur ¯ i                                               comprend K paramètres. Pour les N individus du panel,
on obtient K N paramètres. L’égalité des N vecteurs ¯ i revient donc à imposer K N ¡ K restrictions.
De la même façon, l’égalité des N constantes revient à imposer N ¡ 1 restrictions. Au total,
l’hypothèse
   1
H 0 revient à imposer (K + 1) (N ¡ 1) restrictions linéaires.
La seconde étape consiste à tester l’égalité pour tous les individus des K com-
posantes des vecteurs ¯ i .
                             H02 : ¯ i = ¯8 i 2 [1; N ]

                             H 2a : 9 (i; j) 2 [1; N ] = ¯ i =
                                              ¯j

    Sous l’hypothèse nulle, on n’impose ici aucune restriction sur les constantes
indi- viduelles ®i : De la même façon, on construit une statistique de Fischer pour
tester ces (N ¡ 1) K restrictions linéaires.            Toujours sous l’hypothèse
d’indépendance et de normalité des résidus, cette statistique suit une loi de Fischer
avec (N ¡ 1) K et N T ¡ N (K + 1) degrés de liberté. Si l’on rejette l’hypothèse nulle
                                                            2
H 0 d’homogénéité des coef-
…cients ¯ i , on rejette alors la structure de panel, puisque au mieux seules les constantes
®i peuvent être identiques entre les individus :

                                  yi;t = ® + ¯i0 xi;t + "i;t                            (1.4)

   On estime alors les paramètres vectoriels ¯ i en utilisant les modèles di¤érents

      pays
par pays. Si en revanche, on accepte l’hypothèse nulle H20 d’homogénéité des coe
¢cients
¯ i ; on retient la structure de panel et l’on cherche alors à déterminer dans une
troisième étape si les constantes ®i ont une dimension individuelle.

   La troisième étape de la procédure consiste à tester l’égalité des N constantes indi-
viduelles ®i ; sous l’hypothèse de coe¢cients ¯ i communs à tous les individus :

                                   3
                                 H0 : ®i = ® 8 i 2 [1; N ]
                               3
                             H a : 9 (i; j) 2 [1; N ] = ®i = ®j

    Sous l’hypothèse nulle, on impose ¯ i = ¯: Sous l’hypothèse d’indépendance et
de normalité des résidus, on construit une statistique de Fischer pour tester ces N
¡
1 restrictions linéaires. Cette statistique suit une loi de Fischer avec (N ¡ 1) K
et N (T ¡ 1) ¡ K degrés de liberté. Si l’on rejette l’hypothèse nulle H 0 d’homogénéité
                                                                    3
des constantes ®i , on obtient alors un modèle de panel avec e¤ets individuels :

                                  yi;t = ®i + ¯ 0 xi;t + "i;t                           (1.5)

   Dans le cas où l’on accepte l’hypothèse nulle H30 , on retrouve alors une structure de
                                                                  0
panel totalement homogène (modèle pooled ). Le test H
                                                  3                   ne sert alors qu’à con…
                                                  0
rmer ou in…rmer les conclusions du 1tests H ; étant donné que le fait de réduire le
nombre de restrictions linéaires permet d’accroître la puissance du test du Fischer.
1.2.2. Construction des statistiques de test

Nous allons à présent, présenter les méthodes de construction des di¤érents tests de
Fischer utilisés dans cette procédure. On considère le modèle (1.1) et l’on suppose que
les résidus "i;t sont indépendamment distribués dans les dimensions i et t; suivant
une
loi normale d’espérance nulle et de variance …nie ¾ 2 . On suppose que la variance ¾2
est                                              "                               "
connue.

Test d’homogénéité globale On considère tout d’abord, le test de l’hypothèse
d’homogénéité totale H 01 :
                                1
                              H 0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N
                                               ]

   Soit F1 la statistique de Fischer associée à ce test. Ce test revient à imposer
(K + 1) (N ¡ 1) restrictions linéaires sur les coe¢cients du modèle (1.1). De
plus, sous l’hypothèse alternative H 2 ; il existe au plus N K coe¢cients di¤érents
                              a
pour les composantes des N vecteurs ¯ i (de dimension K) et N constantes
individuelles. On dispose donc de N T ¡ N (K + 1) degrés de liberté.

De…nition 1.1. La statistique de Fischer F1 associée au test d’homogénéité totale H01
dans le modèle (1.1) :

                           1
                          H0 : ¯ i = ¯        ®i = ® 8 i 2 [1; N ]
                                      (K;1)


s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1) (K + 1) et N T ¡N (K +
1)
degrés de liberté :
                              (SCR1;c ¡ SCR1 ) = [(N ¡ 1) (K + 1)]
                     F1 =                                                        (1.6)
                                  SCR1 = [N ¡ N (K + 1)]
                                  T

où SC R1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c la somme
des carrés des résidus du modèle contraint :

                                   yi;t = ® + ¯ 0 xi;t + "i;t

    Ainsi, si la réalisation de la statistique de Fischer pour l’échantillon considéré
est supérieure au seuil théorique à ®%; on rejette l’hypothèse nulle d’homogénéité.
Reste à présent à déterminer la formule générale des sommes de carrés des résidus des
modèles contraint et non contraint. Considérons tout d’abord le modèle non
contraint :

                                  yi;t = ®i + ¯ 0i xi;t + "i;t

   Les estimateurs ¯bi e®i des paramètres individuels sont obtenus équation par équa-
                        t
   b
tion pour chaque individu. Soit SCR1;i la somme des carrés des résidus obtenue pour
chaque équation. La somme des carrés des résidus du modèle (1.1) non contraint est
alors tout simplement dé…nie comme la somme des N somme des carrés des
résidus
obtenues pour les N équations individuelles.
                            X
                            N                     X
                                                  N     h                              i
                                                                     0    ¡1
                  SCR1 =          SCR1;i =              Syy;i ¡      xy;iSxx;i Sxy;i        (1.7)
                                                              S
                            i=1                  i=1


où les sommes Sk;i sont dé…nies de la façon suivante 8 i 2 [1; N ] :
                                                X
                                                T
                                                                     2
                                  Syy;i =             (yi;t ¡ yi )                          (1.8)
                                                t=1

                                      X
                                      T
                                                                            0
                            Sxx;i =         (xi;t ¡ xi ) (xi;t ¡ xi )                       (1.9)
                                      t=1
                                      X
                                      T
                                                                            0
                            Sxy;i =         (xi;t ¡ xi ) (yi;t ¡ y i )                     (1.10)
                                      t=1
   Les moyennes xi et yi sont dé…nies, pour chaque individu, dans la dimension
tem- porelle de façon traditionnelle par 8 i 2 [1; N ] :
                                             T
                                           1X
                                      xi =     xi;t
                                           T
                                                      t=1

                                             T
                                           1X
                                      yi =     yi;t
                                           T
                                                      t=1

    L’expression de SCR1 fait ainsi apparaître la somme des variances individuelles
des résidus obtenues à partir des N régressions individuelles. L’expression Syy;i
¡
       ¡1
Sxy;i Sxx;i Sxy;i correspond ainsi (à une transformée linéaire près) à la variance intra-
 0

groupe (Within variance) des résidus.


   Le modèle (1.1) contraint sous l’hypothèse H01 s’écrit :

                                  yi;t = ® + ¯ 0 xi;t + "i;t                               (1.11)

   On dispose ainsi d’un échantilon de T N observations pour identi…er les

    paramètres
communs ® et ¯ de cette relation. On applique alors les Moindres Carrés Ordinaires
sur les données empilées (modèle pooled). La somme des carrés s’écrit sous la forme :

                              SC R1;c = Syy ¡ S 0 Sxx Sxy
                                              xy
                                                   ¡1
                                                                                           (1.12)


où les sommes Sk sont dé…nies de la façon suivante :
                                            N     T
XX
                                  2
Syy =             (yi;t ¡ y i )       (1.13)
        i=1 t=1
XX
                                     N T
                                                                           0
                           Sxx;i =             (xi;t ¡ xi ) (xi;t ¡ xi )         (1.14)
                                     i=1 t=1

                                     XX
                                     N T
                                                                            0
                           Sxy;i =             (xi;t ¡ xi ) (yi;t ¡ y i )        (1.15)
                                     i=1 t=1

     Les moyennes x et y sont alors dé…nies sur l’ensemble des T N observations :

                                         1 XX
                                                 N    T
                                     x=       xi;t
                                        NT
                                                 i=1 t=1


                                           1 XX
                                                 N    T
                                     y=         yi;t
                                          NT
                                                 i=1 t=1

     L’expression SCR1;c     correspond à une transformée de la variance totale des
résidus (total variance) obtenus à partir de l’estimation d’un modèle unique sur les N T
données empilées.

Test d’homogénéité des coe¢cients ¯ i
  Considérons à présent le test de l’hypothèse d’homogénéité des coe¢cients ¯ i , notée
 2
H0 :
                                  2
                                H0 : ¯ i = ¯ 8 i 2 [1; N ]

    Soit F2    la statistique de Fischer associée à ce test. Sous l’hypothèse nulle, on
n’im- pose    aucune restriction sur les constantes individuelles ®i : Toujours sous
l’hypothèse   d’indépendance et de normalité des résidus, on construit une
statistique   de Fischer pour tester ces (N ¡ 1) K restrictions linéaires. aSous
l’hypothèse alternative H 2 ; on
retrouve le modèle (1.1) et N T ¡ N (K + 1) degrés de liberté.

De…nition 1.2. La statistique de Fischer F2 associée au test d’homogénéité totale H02
dans le modèle (1.1) :
                                 2
                               H 0 : ¯i = ¯          8 i 2 [1; N ]
                                           (K;1)


s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1) K et N T ¡ N (K +
1)
degrés de liberté :           ¡                  ¢
                                SC R1;c0 ¡ SCR1 = [(N ¡ 1) K]
                        F2 =                                               (1.16)
                                 SCR1 = [N ¡ N (K + 1)]
                                 T

où SCR1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c0 la somme
des carrés des résidus du modèle contraint (modèle à e¤ets individuels) :

                                 yi;t = ®i + ¯ 0 xi;t + "i;t
La somme des carrés des résidus du modèle non contraint, SC R1 ; est donnée par
l’équation (1.7). Sous l’hypothèse H02 ; la somme des carrés des résidus dans le modèle
à e¤ets individuels est donnée par :
                                   Ã           !0 Ã        !¡1 Ã           !
                         X
                         N           X
                                     N              X
                                                    N            XN
             SC R1;c0 =     Syy;i ¡       Sxy;i       Sxx;i          Sxy;i        (1.17)
                        i=1           i=1            i=1          i=1



où les sommes Sk;i ont été dé…nies par les équations (1.8), (1.9) et (1.10). Cette
écriture signi…e que dans le modèle à e¤ets individuels, les estimateurs (Within ) des
paramètres
¯ i et ®i sont obtenus en centrant les variables sur leurs moyennes individuelles
respec- tives. Nous reviendrons par la suite sur cette propriété.

Test d’homogénéité des constantes ®i
  Considérons en…n le dernier test d’homogénéité des constantes ®i , notée H03 :
                                  3
                                H0 : ®i = ® 8 i 2 [1; N ]

   Soit F3 la statistique de Fischer associée à ce test. Sous l’hypothèse nulle,
on impose l’égalité des paramètres ¯ i : Sous l’hypothèse d’indépendance et de
normalité des résidus, on construit une statistique de Fischer pour tester ces N ¡ 1
restrictions
linéaires. Sous l’hypothèse alternative Ha3 ; les coe¢cients ¯ i sont tous égaux, mais les

constantes di¤èrent selon les individus. On a donc N T ¡ N ¡ K degrés de liberté.

De…nition 1.3. La statistique de Fischer F3 associée au test d’homogénéité totale H03
dans le modèle (1.1) :
                                  3
                                H 0 : ®i = ® 8 i 2 [1; N ]
s’écrit sous la forme suivante et suit un Fischer avec N ¡ 1 et N (T ¡ 1) ¡ K degrés
de liberté :                    ¡                    ¢
                                  SCR1;c ¡ SCR1;c0 = (N ¡ 1)
                          F3 =                                                (1.18)
                                   SC R1;c0= [N (T ¡ ¡ K]
                                                   1)

où SC R1;c0 désigne la somme des carrés des résidus du modèle (1.1) sous l’hypothèse
¯ i = ¯ (modèle à e¤ets individuels) et SCR1;c la somme des carrés des résidus du
modèle contraint (modèle de pooled) :

                                 yi;t = ® + ¯ 0 xi;t + "i;t

    Les sommes des carrés des résidus SCR1;c0 et SC R1;c ont été respectivement dé…
nies par les équations (1.17) et (1.12).

   Il est en outre possible de tester la constance dans le temps des di¤érents
paramètres du panel suivant une procédure sensiblement identique (voir Hsiao 1986).
Mais cette problématique relève plus de la notion traditionnelle de stabilité des coe
¢cients dans le temps que de la pure application des techniques économétriques de
données de panel.
1.3. Application

Considérons à présent une application simple de ces tests d’homogénéité à partir de
données de panel relatives au nombre de grèves dans le secteur industriel4 . Les données
annuelles couvrent 17 pays5 de l’OCDE et sont disponibles de 1951 à 1985. Soit si;t
le nombre de jours chômés pour cause de grève, pour 1000 salariés du secteur
industriel, du pays i observé à la date t. Nous cherchons à relier cette variable d’une
part au taux de chômage de l’économie, noté ui;t ; et d’autre au niveau de l’in‡ation,
notée pi;t ; selon la relation linéaire suivante :

                         si;t = ®i + ¯ i ui;t + ° i pi;t + "i;t 8 i = 1; ::; 17               (1.19)

    Appliquons la stratégie de test d’homogénéité à ce modèle. Pour ce faire, nous
utiliserons directement les résultats des tests programmés sous TSP (version 4.3A
ou versions ultérieures). Les commandes TSP sont donc les suivantes :

               load(file=’’strikes.wks’’);
               panel (id=i,time=t,byid) srt u p;

    La première ligne du programme sert tout simplement à lire les données du …chier
strike.wks. La seconde ligne du programme permet d’obtenir l’ensemble des
estima- teurs de base (pooled, between, e¤ets …xes et e¤ets aléatoires) ainsi que
les résultats des principaux tests de spéci…cation (tests d’homogénéité et test
d’Hausman). L’option id = i indique le nom de l’indicatrice pays et l’option time = t
indique le nom de l’indi- catrice temporelle. L’option byid est nécessaire pour a
¢cher l’ensemble des résultats des tests de spéci…cation6 . Les variables sont
respectivement nommées srt , u et p.

    Sur la …gure (1.2) sont reportés les résultats d’estimation de cette procédure TSP.
Nous allons nous concentrer plus particulièrement sur l’analyse des résultats des
tests d’homogénéité. TSP propose, avec l’option byid, les trois tests de Fischer
présentés précédemment.
    On observe tout d’abord le panel est cylindré (balanced), c’est à dire qu’il
comporte le même nombre de points dans la dimension temporelle pour tous les
individus. On a ici N = 17 et T = 35; soit 595 observations. Commençons tout
d’abord par le test
   4
     Les données      ont été collectées par           Bruce    Western et proviennent du         site
http://lib.stat.cmu.edu/datasets/
   5
     Le panel comporte initialement 18 pays, mais pour le pays 3, les données ne sont disponibles que
jusqu’en 1980. C’est pourquoi a…n de travailler sur un panel cylindré nous avons choisi de retirer ce
pays de notre échantillon.
   6
     Pour plus de détails sur l’instruction panel sous TSP, se reporter au manuel de programmation du
logiciel.
Figure 1.2: Résultats des Tests de Spéci…cation sous TSP 4.3A
de l’hypothèse d’homogénéité totale (test H 1 dans nos notations). Ce dernier est
                                          0
noté sous la forme F test of A; B = Ai ; Bi dans le …chier résultat de TSP. La
lettre A désigne ici les constantes, tandis que la lettre B désigne le vecteur des coe
¢cients des variables explicatives. Dans le cadre de notre échantillon, la réalisation de
                                                 1
la statistique de Fischer associée au test H
                             0                       , notée F1 ; est de 3:8320. Le logiciel
indique en outre le nombre de degré de liberté de cette statistique. Nous avons vu
précédemment que F1 suivait un Fischer avec (N ¡ 1) (K + 1) et N T ¡ N (K + 1)
degrés de liberté. Compte tenu des dimensions de notre panel et du nombre de
variables explicatives (K = 2), on doit donc comparer la valeur de cette réalisation
au seuil d’un Fischer F (48; 544) : Le logiciel nous donne directement la pvalue
associée à ce test. En l’occurrence ici, cette pvalue est très largement inférieure au
seuil de 5%, donc pour ce seuil, on rejette
l’hypothèse nulle H0 d’égalité des constantes ®i et des coe¢cients ¯ i et
°i:


   Il convient alors de tester l’hypothèse H0 2 ; d’égalité des coe¢cients       et ° i (co-
   ¯i

e¢cients associés aux variables explicatives) entre les pays. Ce test est noté sous
la forme F test of Ai ; B = Ai ; Bi dans le …chier résultat de TSP. Dans le cadre
de notre échantillon, la réalisation de la statistique de Fischer associée au test H 2 ,
                                                                               0
notée
F2 ; est de 1:1845. Cette valeur est à comparer au seuil d’un Fischer avec (N ¡ 1) K
et N T ¡ N (K + 1) degrés de liberté , c’est à dire ici un F (32; 544) : La pvalue
indique ici que jusqu’au seuil de 25%, l’hypothèse nulle ne peut pas être rejetée. A 5%,
on con-
…rme donc ici la structure de panel, puisque l’on est en droit de supposer qu’il existe
des coe¢cients communs pour tous les pays entre le volume des grèves et les variables
explicatives que sont le chômage et l’in‡ation.


   Reste en…n à tester l’hypothèse 0 3 de constantes individuelles ®i : Ce test est
                                     H
noté sous la forme F test of Ai ; B = Ai ; B dans le …chier résultat de TSP. Dans le
cadre de notre échantillon, la réalisation de la statistique de Fischer associée 0au
test H 3 , notée F3 ; est de 9:0342. Cette valeur est à comparer au seuil d’un Fischer
avec N ¡ 1 et N (T ¡ 1) ¡ K degrés de liberté , c’est à dire ici un F (16; 576) : La
pvalue est très
largement inférieure au seuil de 5%. Pour ce seuil, on rejette l’hypothèse nulle H0
d’égalité des constantes ®i : Il est nécessaire d’introduire ici des e¤ets individuels.
La spéci…cation …nale de notre modèle est donc :

                      si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17               (1.20)

   Reste à présent à étudier les di¤érentes méthodes d’estimation des modèles

   incluant
des constantes individuelles.
L’Econométrie des Données de Panel                                                      20




2.     Modèles           à      e¤ets
individuels

Nous allons à présent nous à des modèles de panel hétérogènes, où la seule source
d’hétérogénéité provient des constantes individuelles. On suppose ainsi que les coe¢-
cients des di¤érentes variables stochastiques explicatives sont identiques pour tous
les individus du panel (¯ i = ¯). On suppose en outre que ces coe¢cients sont des
con-
stantes déterministes. Les constantes individuelles ®i ; quant à elles, di¤èrent selon
les
individus.

Hypothèse (H1) On suppose que les N vecteurs de paramètres ¯ i sont
identiques,
      ¯ i = ¯ 2 R; 8 i 2 [1; N ] ; tandis que les constantes ®i peuvent di¤érer selon
                                                                                   2
     les individus.   En particulier, il existe au moins un couple (j; i) 2 [1; N ] tel
     que
     ®j = ®i

   Sous l’hypothèse (H 1), le modèle (1.1), s’écrit sous la forme suivante :


                                 yi;t = ®i + ¯ 0 xi;t + "i;t                       (2.1)

où ®i 2 R et ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) 2 RK est un vecteur de constantes. Les innovations
"i;t
sont supposées être i:i:d: de moyenne nulle, de variance égale à ¾ 2 ; 8 i 2 [1; N ] et
                                                                    "
sont supposées non corrélées que ce soit dans la dimension individuelle ou dans la
dimension temporelle.
     Dès lors, dans ce contexte, on doit distinguer deux cas : le cas où les paramètres
®i sont des constantes déterministes (modèle à e¤ets …xes) et le cas où les paramètres
®i sont des réalisations d’un variable      aléatoire d’espérance et de variance       …nie
(modèle à e¤ets aléatoires). Nous allons donc successivement envisager ces deux types
de modèle (sections 3 et 4). Toutefois, avant de présenter ces deux modèles, nous
commencerons tout d’abord par introduire les di¤érentes méthodes d’empilement de
données de panel qui autorisent une écriture vectorielle du modèle à e¤et individuel.

    En e¤et, il existe deux possibilité d’écriture vectorielle du modèle (2.1). Autrement
dit, il existe deux façons d’empiler les données :

  1. Empilement par individus : pour une variable donnée, les T réalisations
     his- toriques de chaque individu sont stockées dans un vecteur colonne, et
     les N vecteurs colonnes ainsi obtenus sont ensuite empilés à la suite des uns des
     autres dans l’ordre des individus.
L’Econométrie des Données de Panel                                                    21


  2.     Empilement par dates : pour une variable donnée, les N réalisations
       individuelles pour une date donnée sont stockées dans un vecteur colonne, et
       les T vecteurs colonnes ainsi obtenus pour toutes les dates sont ensuite
       empilés à la suite des uns des autres.

   Il est très important de noter que les principaux logiciels d’économétrie
(notamment TSP) optent généralement pour une méthode d’empilement par pays.
                                                                         Si le logiciel
n’empile pas lui même les données, les séries utilisées dans le cadre des applications
doivent, de façon impérative, être ordonnées sous la forme préconisée par les
concepteurs du logiciel.

2.1. Empilement par pays

Considérons tout d’abord la méthode d’empilement par pays. On considère un échan-
tillon de N individus sur T périodes, et un modèle avec K variables explicatives. On
pose :
             0      1           0                                      0      1
               yi;1                x1;i;1    x2;i;1       :::            "i;1
             B      C                                                  B      C
             B yi;2 C                       1                          B "i;2 C
          i
               :::                  xK;i;1                         i =
                                                              C          :::
                                B
                                B x1;i;2 x2;i;2 ::: xK;i;2 C
                          Xi =                                   "
                                  :::      :::      ::: :::
        y =@        A (T ;K) @                                A (T ;1) @      A
      (T ;1)
               yi;T                x1;i;T x2;i;T ::: xK;i;T              "i;T


   On dé…nit en outre un vecteur unitaire, noté e; tel que :
                                         0     1
                                            1
                                         B 1 C
                                    e =B       C
                                  (T ;1) @ ::: A

                                              1


De…nition 2.1. Dans le cas de l’empilement par pays, pour chaque individu 8i 2
[1; N ] ; le modèle (2.1) peut s’écrire sous la forme :

                          yi = e®i + Xi ¯ + "i    8 i = 1; ::; N                   (2.2)


    C’est principalement cette expression du modèle (2.1) que l’on utilisera par la suite
pour étudier les estimateurs du modèle linéaire simple. On peut toutefois écrire
le modèle de façon totalement vectorielle en empilant les vecteurs yi et les matrices
Xi :
Pour cela on pose :
                      01                    0    1                 0  1
                   y1                        X1                    "1
                 B y2 C                    B X C                 B" C
              Y =B     C
                                      X   =B 2 C              " =B 2 C
                   :::                       :::                  :::
L’Econométrie des Données de Panel
                  @     A                  @        A             @        A   22
           (T N;1)              (T N;K )                (T N;1)
                     yN                        XN                     "N
On dé…nit 0T le vecteur nul         de dimension (T ; 1) :
                       0                           1                            0    1
                          e                                                       ®1
                       B 0T                            C                        B ®2 C
                 e =                   0T     :::   0T              ® =
                       B               e      :::   0T C                        B     C
                 e
             (T N ;N ) @ :::
                                                                    e
                                       :::    :::   0T A          (N;1)         @ ::: A
                          0T           0T     :::   e                             ®N

   On obtient alors la représentation vectorielle suivante :

                                                 e
                                                e® + X ¯ + "                                                  (2.3)

2.1.1. Exemple

Considérons un panel de 2 pays (N = 2), dont les données annuelles sont disponibles
sur 3 ans (T = 3). On cherche à estimer une fonction de production log-linéaire (Cobb-
Douglass), supposée commune à ces deux pays. Soit yi;t le logarithme du P I B, ki;t
le logarithme du stock de capital privé et ni;t le logarithme de l’emploi. On suppose
que cette fonction de production s’écrit sous la forme :

                    yi;t = ®i + ¯ k ki;t + ¯ n ni;t + "i;t 8 i 2 [1; 2] ; 8 t 2 [1; T ]

où ¯ k     et ¯ n désignent respectivement les élasticités (supposées communes aux
deux pays) de la production par rapport au capital et à l’emploi. L’e¤et individuel ®i
mesure ici les spéci…cités a-temporelles de la productivité totale des facteurs qui
correspond dans cette régression, aux résidus "i;t : Ce modèle s’écrit sous forme
vectorielle de la
façon suivante :
             0        1 0 1         0             1            0       1
                 yi;1       1           ki;1 ni;1   µ      ¶      "i;1
                                                       ¯
                @ yi;2 A = @ 1 A ®i + @ ki;2 ni;2 A                         k
                                                                                    + @ "i;2 A
                                                                        ¯
                                                                            n
                    yi;3           1                ki;3 ni;3                             "i;3


                            () yi = e®i + Xi ¯ + "i             8 i = 1; ::; N

   L’écriture vectorielle complète du modèle est la suivante :
  0         1                          0                  1                                      0
                 0         1
      y1;1           1 0                   k1;1     n1;1                                               "1;1
            C B                                                                                        1
  B y
  B    1;2  C B 1 0 C                  B k1;2
                                       B            n1;2 CCµ
                           Cµ          B k1;3
      y1;3          1 0        ®1 +                 n1;3 C
                                                                                                 B            C
                                                                                                              C
                                                                                                 B   "1;2     C
                                                                                                     "1;3
                                                                                             +
  B             C                         ¶
  B             C       B      C                B                               C    ¯k          B            C
                    =

  B             C       B      C                B                               C                B            C
         y2;1                                         k2;1       n2;1                                "2;1
B          C   B 0 1 C   ®2   B                   C   ¯n       B          C

B          C   B    C         B                   C        ¶   B          C
    y2;2                           k2;2    n2;2                    "2;2

@          A   @0 1 A         @                   A            @          A
    y2;3        0 1                k2;3    n2;3                    "2;3


                                   e
                                  e® + X ¯ + "
2.2. Empilement par dates

De façon parallèle, il est possible de représenter de façon symétrique le modèle (2.1)
en utilisant la méthode d’empilement par dates. Pour ce faire, il su¢t de poser
les dé…nitions suivantes :
            0       1            0                                     0       1
               y1;t                 x1;1;t     x2;1;t      :::            "1;t
            B       C                         1                        B       C
            B y2;t C                                                   B "2;t C
       t                              xK;1;t                       t =
               :::               B                             C          :::
                           Xt =  B x1;2;t x2;2;t ::: xK;2;t C     "
                                    :::      :::      ::: :::
      y =@          A            @                             A       @       A
    (N;1)                (N;K)                                          (T ;1)
              yN;t                   x1;N;t x2;N;t ::: xK;N;t                    "N;t



De…nition 2.2. Dans le cas de l’empilement par dates, pour chaque date t 2 [1; T ]
;
le modèle (2.1) peut s’écrire sous la forme :

                             yt = e + Xt ¯ + "t
                                  ®               8 t = 1; ::; T                        (2.4)

     De la même façon, il est possible d’exprimer le   modèle (2.1) sous une forme vecto-
rielle complète. On pose :
                     0      1                 0         1               0    1
                        y1                      X1                       "1
                     B y2 C                   B X2     C               B " C
                Y =B        C           X =B           C              =B 2 C
                        :::                     :::                      :::
                     @      A                 @         A              @     A
             (T N;1)                 (T N;K )                    "
                                                              (T N;1)
                        yT                        XT                     "T

   Soit IN la matrice identité de dimension (N; N ) : On dé…nit la matrice suivante :
                                           0     1
                                             IN
                                           B     C
                                     e = B IN C
                                     e
                                 (T N ;N ) @ ::: A
                                             IN

   Il vient alors :
                                          e
                                         e® + X ¯ + "                                   (2.5)

2.2.1. Exemple

Reprenons l’exemple présenté précédemment. Lorsque les données sont empilées
par dates, ce modèle s’écrit sous forme vectorielle de la façon suivante :
               µ      ¶ µ         ¶ µ              ¶µ       ¶ µ          ¶
                 y1;t         ®1 + k1;t n1;t             ¯ k + "1;t
                        =
                 y2;t         ®2        k2;t n2;t        ¯n         "2;t




                        () yt = ® + Xt ¯ + "t
                                e                      8 t = 1; ::; T
L’écriture vectorielle complète du modèle est la suivante :
 0         1                          0                  1         0           1
     y1;1       0         1               k1;1     n1;1                 "1;1
                    1 0               B k2;1
                                      B            n2;1 C
 B y2;1 C B 0 1 C µ
 B
 B         C    B         C       ¶ B                    C
                                                                 ¶ B
                                                                   B
                                                                   B    "2;1   C
                                                                               C
                                          k1;2           Cµ
     y1;2       B1 0          ®1                   n1;2       ¯k        "1;2
 B         C                                                       B           C
                 B
 B         C=                                                     +B           C
     y2;2                 C           B k ;2             C              "2;2
                          C         +B                   C
                                                         C         B           C
 B         C B 0 1 C ®2
                B
                          C
                                      B
                                      B    2       n2;2 C ¯n       B           C
 B         C @            A           B                  C                     A
 @ y1;3 A          1 0                @ k1;3                       @
                    0 1                            n1;3 A               "1;3
     y2;3                                 k2;3     n2;3                 "2;3


                                        e
                                       e® + X ¯ + "


    Maintenant que nous avons présenté l’écriture vectorielle des modèles de panel
à e¤ets individuels, nous allons à présent étudier les propriétés des estimateurs
des paramètres de ces modèles suivant la spéci…cation des e¤ets individuels. Nous
dis- tinguerons pour cela deux cas : le cas des e¤ets …xes et le cas des e¤ets
aléatoires.
3. Modèle à e¤ets …
xes

On fait maintenant l’hypothèse que les e¤ets individuels ®i sont représentés par
des constantes (d’où l’appellation modèle à e¤ets …xes ). Nous allons déterminer la
forme générale des estimateurs des paramètres ®i et ¯ dans ce modèle à e¤ets …
xes. On considère donc le modèle (1.1) sous l’hypothèse (H 1) :

                    yi;t = ®i + ¯ 0 xi;t + "i;t 8 i 2 [1; N ] ; 8 t 2 [1; T ]               (3.1)

où ®i 2 R, ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) 2 RK . Tous les paramètres du modèle sont des
constantes et l’on suppose pour simpli…er qu’il n’existe pas d’e¤et temporel. On dé…
nit le vecteur
"i tel que :                                            ¢0
                                    ¡
                              "i = "i;1 "i;2 ::: "i;T
                              (T ;1)


    Pour étudier les propriétés des estimateurs du modèle à e¤ets …xes, nous allons
faire une hypothèse supplémentaire sur la nature du processus des résidus "i;t :
Cette hypothèse constitue tout simplement la généralisation dans la dimension de
panel de la dé…nition d’un bruit blanc.

Hypothèse (H2) On suppose que les résidus "i;t sont i:i:d: et satisfont les
    conditions suivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ]
    ² E ("i;t ) = 0 ½
                         ¾2"   t=s
    ² E ("i;t "i;s ) =                 ; ce qui implique que E ("i "0 ) = ¾2 IT où It désigne
                                                                    i      "
                          0 8t = s
    la matrice identité (T ; T ) :
    ² E ("i;t "j;s ) = 0; 8j = i; 8 (t; s)

    La première condition impose tout simplement que l’espérance des résidus du mod-
èle (3.1) soit nulle. La seconde condition, standard en économétrie des séries
tem- porelles, impose que le processus "i;t soit un processus ”sans mémoire” (dans
la di- mension temporelle). Pour chaque individu, il n’existe ainsi aucune corrélation
entre le niveau présent du processus "i;t et les réalisations passées.       Seule la
variance   du processus     "i;t est    non nulle.       L’introduction         d’une   dimension
individuelle, nous oblige ici à dé…nir une seconde contrainte qui est que tous les
processus individuels "i;t ont
la même variance ¾2 quel que soit l’individu considéré. Autrement dit, la matrice
                    "
de
variance covariance du processus "i est proportionnelle, à un scalaire près, à la
matrice identité.      En…n, la troisième condition stipule qu’il n’existe aucune
corrélation entre les processus d’innovation pour deux individus distincts et cela
quelle que soit la date considérée.
3.1. Estimateur Within ou LSDV

Considérons l’écriture vectorielle du modèle obtenue par un empilement des
données par pays.
                    yi = e ®i + Xi ¯ + "i            8 i = 1; ::; N                               (3.2)

                       (T ;1)   (T ;1)            (T ;K)(K;1)       (T ;1)


   L’estimateur des Moindres Carrés Ordinaires (M C O) des paramètres ®i et ¯ dans
le modèle à e¤ets …xes est appelé estimateur W ithin; ou estimateur à e¤ets …xes
ou estimateur LSDV (Least Square Dummy Variable ). Comme nous l’avons vu, le
terme W ithin s’explique par le fait cet estimateur tient compte de la variance intra
groupe de la variable endogène. La troisième appellation LSDV tient au fait que cet
estimateur conduit à introduire des variables dummies, qui dans la spéci…cation (3.2)
correspondent aux vecteurs colonnes de e:

   On peut démontrer que sous l’hypothèse (H 2), l’estimateur des Moindres
Carrés Ordinaires (MCO) des paramètres ®i et ¯ du modèle (3.2) est le meilleur
estimateur linéaire sans biais (BLU E 7 ). Si l’on suppose que ¾ " est connu, cet
estimateur est obtenu en minimisant la variance des résidus empiriques, notée S;
par rapport aux
seuls paramètres ®i et ¯:
                                 N                    N
                                 X                    X
               min                                                               0
                   N
                          S=             "i0 "i   =         (yi ¡ e®i ¡ Xi ¯) (yi ¡ e®i ¡ Xi ¯)

             f®i ;¯gi=1
                                 i=1                  i=1


    La première condition nécessaire de ce programme; nous donne immédiatement
l’expression de l’estimateur de la constante ®i , 8 i 2 [1; N ] :
                                                                0
                                           ® i = y i ¡ ¯b      xi                                 (3.3)
                                              b           LSDV

où les termes y i et xi désignent les moyennes individuelles des variables endogènes
et exogènes.
                           1X                1X
                              T                 T
                     yi =        yi;t  xi =        xi;t 8 i 2 [1; N ]            (3.4)
                       (1;1)     T   t=1               (K;1)    T    t=1


    Ces moyennes sont donc calculées de façon traditionnelle dans la dimension
tem- porelle, et cela pour chaque individu de l’échantillon. C’est pourquoi elles sont
indicées en i:
    A partir de la seconde condition nécessaire du programme de minimisation, on
montre que l’estimateur du paramètre vectoriel ¯ est donné par la relation suivante :
               "N T                        #¡1 "                           #
                                                                        N    T

                                                                                                  X
    ¯bLSDV                       =
X                                              XX
   (xi;t ¡ xi ) (xi;t                                    (xi;t ¡ xi ) (yi;t ¡   (3.5)
       0
¡ xi )                                         yi )
i=1 t=1                                        i=1 t=1



          7
              Best Linear Unbiased Estimator
Proposition 3.1. L’estimateur W ithin ou LSDV de ¯; obtenu dans le modèle à
e¤ets individuels …xes (3.2) est identique à l’estimateur des M C O obtenu à partir d’un
modèle transformé où les variables expliquées et explicatives sont centrées sur leur
moyennes individuelles respectives :
                                           0
                       (yi;t ¡ y i ) = ¯b (xi;t ¡ xi ) + "i;t                                                             8i 2
                       [1; N ] ; 8 t 2 [1; T ]              (3.6)

Les réalisations des estimateurs des constantes ®i sont alors déduits de la relation
:

                                                         b ®i = y i ¡
                                                                0
                                                             ¯b xi

   En e¤et, on voit d’après l’équation (3.5), que l’estimateur W ithin des coe
¢cients de ¯ peut être obtenu en centrant les di¤érentes (variables endogène et
exogènes) sur les moyennes individuelles respectives. Ainsi, on peut obtenir le
même estimateur en utilisant le modèle transformé suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] :

                                                        yi;t = ¯ 0 xi;t + "i;t
                                                        e

     yi;t       i;t                 xi;t          i;t         i
                       ¡ y i ) et
                       e
avec e = (y                                = (x ¡ x ). En e¤et, dans ce cas on obtient :
                                                       e

                       "                         #¡1 "                         #
                           N   T
                                                          N       T

                        XX                               XX
            ¯b =                    e ei;t                             e e
                         i=1 t=1             0           i=1 t=1 xi;t yi;t
                                    xi;t x
                       "                                                   #¡1 "                                   #
                           N   T                                                   N   T
                        XX                                                     XX
              =                     (xi;t ¡ xi ) (xi;t ¡                                     (xi;t ¡ xi ) (yi;t ¡ y i )
                   0                                                               i=1 t=1
              xi )
                         i=1 t=1




   On reconnaît ici l’expression générale de l’estimateur W ithin ¯bLSDV : Reste alors
   à
obtenir les réalisations des estimateurs des constantes individuelles selon la formule :
                                                                                   0
                                                    b 1 = y 1 ¡ ¯b
                                                    ®
                                                          x1
                                                                   0
                                                    b 2 = y ¡ ¯b
                                                    ®                  2
                                                                      x2
                                                          ::::
                                                   b ®N = y N ¡
                                                          0
                                                        ¯b x N
Le fait qu’il soit équivalent d’estimer les paramètres du modèle (3.2) directement
à partir de cette spéci…cation incluant des dummies individuelles ou à partir d’un
modèle transformé où les variables sont centrées sur leurs moyennes individuelles
respectives est particulièrement important. Cela illustre la notion de variance
intra-classes qui est fondamentale dans la construction de l’estimateur Within. Nous
allons à présent, proposer une illustration de cette propriété de l’estimateur W ithin:
3.2. Application

Considérons à nouveau l’exemple du modèle de grèves dans le secteur industriel.
Nous avons établi précédemment que le modèle de panel comportait des e¤ets
individuels et pouvait s’écrire sous la forme:

                     si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17          (3.7)

où si;t désigne le nombre de jours chômés pour cause de grève, pour 1000 salariés
du secteur industriel, ui;t désigne le taux de chômage de l’économie et pi;t le
taux d’in‡ation. On suppose que l’on peut spéci…er les e¤ets individuels ®i sous la
forme d’e¤ets …xes. Dans le programme ci-dessous, on cherche à comparer l’estimateur
Within et l’estimateur des MCO du modèle transformé :

                    (si;t ¡ si ) = ¯ (ui;t ¡ ui ) + ° (pi;t ¡ pi ) + "i;t      (3.8)

   L’instruction panel de TSP avec les options notot, nobet et novar permet

    d’obtenir
directement et uniquement les résultats de l’estimation W ithin: Pour construire les
es- timateurs du modèle transformé, on doit au préalable centrer les variables sur
leur moyennes individuelles respectives.       Pour     réaliser cette opération on
construit une boucle sur les N = 17 individus, avec un compteur j et à chaque étape
on sélectionne un pays dont le code pays (variable i) est égal à la valeur du
compteur j (instruc- tion select i = j). Pour le sous échantillon sélectionné,
l’instruction msd [Nom de la Variable ] permet alors de calculer di¤érents moments
de la variable considérée sans les a¢cher (si l’on ajoute l’option noprint). En
particulier, la moyenne empirique est stockée dans la variable réservée @mean. Dès
lors, pour chaque individu, on construit de nouvelles variables en centrant sur les
moyennes individuelles correspondantes. En-
…n, il ne reste plus qu’à e¤ectuer la régression par les MCO sur le modèle transformé
(instruction ls ou ols)

            load(file=’’strikes.wks’’);
            ?---- Estimation Within ----
            panel (id=i,time=t,notot,nobet,novar) srt u p;
            ?---- Centrer les Données ---
            do j=1 to 17;
                    select (i=j);
                    msd(noprint) srt;
                    srtc=srt-@mean;
                    msd(noprint) u;
                    uc=u-@mean;
                    msd(noprint) p;
pc=p-@mean;
             enddo;

             ?---- Estimation Modèle Transformé----
             ls srtc uc pc;
             ?---- Affichage des Effets Fixes (Instruction Panel)
             ---- print @fixed;

    Les résultats de ce programme sont reproduits sur la …gure (3.1). On véri…e
que l’estimateur W ithin est totalement équivalent à l’estimateur des M CO
appliqué sur un modèle transformé où les variables endogènes et exogènes ont été
centrées sur leurs moyennes individuelles respectives. Dans les deux cas, les
réalisations des estimateurs des coe¢cients des deux variables               explicatives
(respectivement ui;t et pi;t ) sont stricte- ment identiques (respectivement ¡21:5968 et
16:2729).
    Dans le cas où l’on utilise la commande panel de TSP, on peut a¢cher les
esti- mations des e¤ets …xes en utilisant la commande print @fixed. Dans le cas
où l’on utilise le modèle transformé, il convient alors de reconstruire les
estimateurs des ef- fets …xes selon la formule (3.3) en utilisant les moyennes
individuelles des variables (cf.      programme ci-dessus) et les réalisations des
estimateurs des coe¢cients ° et ¯. Essayons à présent de commenter les
estimations ainsi obtenues. Il s’avère ainsi que le pays 9 a, de façon structurelle, le
plus de journées chômées pour cause de grève. Pour ce pays, di¤érents facteurs
historiques (législation sur le droit de grève) ou soci- ologique (représentation des
syndicats par exemple) expliquent que toutes choses égales par ailleurs (chômage et
in‡ation), la fréquence des grève soit particulièrement élévée. A l’inverse, les pays 15
et 2 ont des e¤ets …xes négatifs. Pour un même niveau de chô- mage et d’in‡ation,
ces deux pays auront le nombre de jours chômés le plus faible de tout notre
échantillon. Il faut bien comprendre que les estimations des e¤ets individu- els ne
peuvent s’analyser qu’en niveau relatif (c’est à dire en comparant les di¤érentes
réalisations individuelles) et non en niveau absolu.
L’Econométrie des Données de Panel                                          30




 Figure 3.1: Comparaison des Estimateurs Whithin et OLS sur Modèle Transformé
L’Econométrie des Données de Panel                                                       31


3.3.             Ecriture
vectorielle

Une façon équivalente d’obtenir l’estimateur W ithin et de montrer l’équivalence avec
le modèle transformé où les variables sont centrées, consiste à travailler directement
avec l’écriture vectorielle (3.2). Par la suite, nous adopterons souvent cette notation
vecto- rielle qui permet d’alléger particulièrement les notations du modèle et des
estimateurs correspondants. On considère donc le modèle vectoriel suivant :

                         yi = e®i + Xi ¯ + "i         8 i = 1; ::; N                   (3.9)


    Nous allons à présent introduire un opérateur matriciel qui permet de centrer
les variables sur leurs moyennes individuelles respectives.

De…nition 3.2. Le modèle (3.9) à e¤et individuels …xes peut s’écrire sous la
forme vectorielle suivante 8 i = 1; ::; N :

                                  Qyi = QXi ¯ + Q"i

où la matrice Q de dimension (T ; T ) est telle que
:
                                              1
                                      Q = IT ¡ ee0                                    (3.10)
                                              T
L’estimateur W ithin du vecteur ¯ est alors dé…ni de la façon suivante
:
                                  "               #¡1 "                #
                                      X
                                      N                   N
                                                          X
                      ¯b LSDV =             Xi0 QXi              Xi0 Qyi              (3.11)
                                      i=1                 i=1



   En e¤et, on peut montrer que les processus transformés Qyi et QXi correspondent
aux variables centrées sur leurs moyennes respectives. En e¤et, on montre que :
                                                 0      1                0     1
           µ           ¶            µ        ¶     yi;1     Ã           ! 1
                                                                 T
                  1                   1
                                               =
                                                   yi;2       1X           1
                                                 B C                     B     C
    Qyi = IT 0 ¡         yi = yi ¡      e0 yi             ¡        yi;t
             ee    T     e            T            :::        T            :::

                                                      B          C                B
                                                      @          A
                                                          yi;T
                                                                                 @ CA
                                                                           t=1
                                                                                  1

   De la même façon, on peut montrer que :
                                            1
                                  QXi = Xi ¡ ee0
                                              T
                                        Xi
L’Econométrie des Données   de Panel                                                    32
      0                            1       0    1
        x1;i;1 x2;i;1 :::   xK;i;1            1
                                                  ³                                                  ´
      B x1;i;2 x2;i;2 :::   xK;i;2 C      1 B 1 C PT               PT                  PT
QXi =
      B                              C¡     B     C
        :::     :::   :::   :::                       t=1 x1;i;t    t=1 x2;i;t   :::    t=1 xK;i;t
      @                              A    T @ ::: A

        x1;i;T x2;i;T :::   xK;i;T            1
Dès lors, a…n d’éliminer les e¤ets individuels de l’équation (3.9), il su¢t de prémul-
tiplier les membres de cette équation par Q. Ainsi 8 i = 1; ::; N

                              Qyi = Qe®i + QXi ¯ + Q"i

                                  () Qyi = QXi ¯ +
                                       Q"i

   En appliquant les M C O à cette expression on obtient donc une écriture
équivalente de ¯bLSDV :
                                "            #¡1 " N        #
                                  X
                                  N               X
                     ¯b LSDV =          0
                                     Xi QXi            0
                                                      Xi Qyi                        (3.12)
                                    i=1              i=1
4.    Modèle           à       e¤ets
aléatoires

Dans la pratique standard de l’analyse économétrique, on suppose qu’il existe un grand
nombre de facteurs qui peuvent a¤ecter la valeur de la variable expliquée et qui
pour- tant ne sont pas introduits explicitement sous la forme de variables
explicatives. Ces facteurs sont alors approximés par la structure des résidus. Le
problème se pose de la façon similaire en économétrie de panel. La seule di¤érence
tient au fait que trois types de facteurs omis peuvent être envisagés. Il y a tout
d’abord les facteurs qui af- fectent la variable endogène di¤éremment suivant la
période et l’individu considéré. Il peut en outre exister des facteurs qui a¤ectent de
façon identique l’ensemble des indi- vidus, mais dont l’in‡uence dépend de la période
considérée (e¤ets temporel). En…n, d’autres facteurs peuvent au contraire re‡éter des
di¤érences entre les individus de type structurelles, c’est à dire indépendantes du
temps (e¤ets individuel).

    Dès lors le résidu, noté "i;t ; d’un modèle de panel peut être décomposé en trois
principales composantes de la façon suivante (Hsiao 1986) 8 i 2 [1; N ] ; 8 t 2 [1; T ] :

                                     "i;t = ®i + ¸t + vi;t                         (4.1)

   Les variables ®i désignent ici les e¤ets individuels qui représentent l’ensemble

     des
spéci…cités structurelles ou a-temporelles de la variable endogène, qui di¤érent
selon les individus. On suppose ici que ces e¤ets sont aléatoires. Les variables
aléatoires
¸t représentent quant à elle les e¤ets temporels strictement identiques pour tous
les individus. En…n, le processus stochastique vi;t désigne la composante du résidu total
"i;t orthogonale aux e¤ets individuels et aux e¤ets temporels. Généralement, on est
conduit à faire un certain nombre d’hypothèses techniques sur cette structure de
résidus.

Hypothèses (H3) On suppose que les résidus "i;t = ®i +¸t +vi;t sont i:i:d: et
    satisfont les conditions suivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ]
    ² E (®i ) = E (¸t ) = E (vi;t ) = 0
     ² E (®i ¸t ) = ½ (¸t vi;t ) = E (®i vi;t ) = 0
                      E
                         ¾2®    i=j
     ² E (®i ®j ) =
                          0    8i = j
                      ½ 2
                        ¾¸      t=s
     ² E (¸t ¸s )
                         0     8t = s
     =                  ½ 2
                           ¾      t = s; i = j
     ² E (vi;t vj;s ) =      v
                            0    8t = s; 8i = j
        ³         ´       ³                      ´    ³
     ² E ®i xi;t = E ¸t x
               0                    =E 0
                                       i;t                                            vi;t
´
0         =0
i;t            x
Sous ces hypothèses, la variance de la variable endogène yi;t conditionnellement aux
variables explicatives xi;t est alors égale à ¾2 = ¾2 + ¾2 + ¾2 . Les variances ¾2 , ¾2
et                                             y   ®    ¸    v                 ®    ¸
¾ 2 correspondent aux di¤érentes composantes de la variance totale. C’est pourquoi, le
  v
modèle à e¤ets aléatoires est aussi appelé modèle à erreurs composés (error component
model ).

    Dans une première étape, nous allons présenter le modèle simple à e¤ets individuels
aléatoires. Nous supposerons ainsi, pour simpli…er l’analyse, qu’il n’existe pas d’e¤et
temporel. Nous proposerons alors une écriture vectorielle du modèle à e¤ets
aléatoires. Dans une seconde étape nous étudierons les estimateurs des di¤érents coe
¢cients de ce modèle.

4.1. Modèle à variance composée

On se limite au cas où il n’existe pas d’e¤et temporel (¸t = 0; 8t). On considère donc
le modèle suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] :

                                     yi;t = ¹ + ¯ 0 xi;t + "i;t                        (4.2)

                                           "i;t = ®i + vi;t                            (4.3)
où ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) est un vecteur de constantes et le processus f"i;t g satisfait
les hypothèses (H3 ). La constante ¹ désigne ici l’espérance inconditionnelle du
processus y;i;t puisque on suppose que E (®i ) = 0; 8 i 2 [1; N ] :

Proposition 4.1. Le modèle à e¤ets individuels aléatoires s’écrit vectoriellement sous
la forme :
                    yi = X       ° + "i           8 i = 1; ::; N                 (4.4)
                          ei

                      (T ;1)   (T ;K +1)            (T ;1)
                               (K+1;1)

                                             ¡      ¢
avec "i = ®i e +     X ei = (e; Xi ) et ° 0 = ¹; ¯ 0 : Sous les hypothèses (H3 ), la
vi ;
                     matrice

de variance covariance de "i ; notée V; est alors dé…nie par :
                      ¡ 0¢        £                      0
                                                           ¤
               V = E "i "i = E (®i e + vi ) (®i e + vi ) = ® 2 ee0 +v ¾2 IT
                                                               ¾                       (4.5)
L’inverse de cette matrice de variance covariance est dé…nie comme :
                                   1 ·     µ           ¶ ¸
                          V ¡1 =                 ¾2
                                                  ®        0
                                      IT ¡              ee                             (4.6)
                                  ¾2         ¾2      2

                                   v          v
                                                + T ¾®


   Donnons ici une démonstration possible de ce résultat8 . On pose                             e
                                                                                               V
   Ve
dé…nition on a Ve V = V Ve = IT : On en déduit que :

                   V Ve = ¾2 ee0 Ve + ¾2 V = IT () ¾ 2 V = IT ¡ ¾2 ee0
= V ¡1 : Par                                     e                e
                                  ®          v                v             ®

        8
          Pour une démonstration plus élégante voir Graybill (1969), Nerlove (1971), Wallace et Hussain
      (1969)
Reste alors à déterminer l’expression de ee0 Ve : Raisonnons par une méthode
                                             de
                                           0 e
coe¢cient indéterminé. On suppose que ee V peut s’écrire sous la forme µee0 où µ 2
R+ . Considérons l’expression de ee0 Ve V en substituant ee0 Ve par son expression, il
vient :


                        ee0 Ve V = µee0 V
                                        ¡               ¢
                                 = µee0 ¾ 2® e0 + ¾v IT
                                                    2
                                        £ ¡e ¢ ¤             ¡ ¢
                                      2      0    0        2   0
                                 = µ¾® e e e e + µ¾ ee   v




    Par dé…nition de Ve ; on a ee0 Ve V = ee0 : Sachant que e (e0 e) e0 = T ee0 ; on
    obtient
alors la relation suivante :
                                      ee0 Ve V =
                                             ee0
                                       ¡          ¢
                                () µee0 ¾ 2 T + ¾2 =
                                        ®ee0   v

   On en déduit immédiatement la valeur du paramètre µ :
                                             1
                                  µ=                       2 R+
                                        ®T   + ¾v

   On obtient ainsi :                  ¾2              2


                                       µ                       ¶
                                                   1
                                ee Ve =
                                  0
                                                                   ee
                                                                      0
                                            ¾2             2
                                             ®T    + ¾v
   Dès lors, en reprenant l’expression de Ve , il vient :
                                          µ           ¶
                                                  2
                               2 e = I         ¾®
                             ¾v V      T ¡ 2         2 e
                                                          e0
                                           ¾ T
                                            ®    + ¾v

   Ainsi, l’inverse de la matrice de variance covariance des "i s’écrit sous la forme :
                                     ·      µ           ¶ ¸
                             ¡1    1              ¾2
                                                   ®        0
                           V    =     IT ¡               ee
                                              ¾2      2
                                  ¾2
                                   v           v
                                                 + T ¾®


   L’écriture vectorielle du modèle à e¤ets aléatoires de la proposition (4.1) nous sera
particulièrement dans la section suivante pour construire les estimateurs des
di¤érents paramètres de ce modèle.

4.2. Estimateurs du modèle à e¤ets aléatoires

Nous allons à présent nous intéresser aux propriétés des estimateurs du modèle aléa-
toire. Pour bien comprendre ces propriétés, il est nécessaire de bien appréhender les
conséquences de la structure des résidus.
Remark 1. Dans le modèle de la proposition (4.1), le fait que les e¤ets individuels
®i constituent l’une des composantes des résidus "i du modèle (4.4), induit une
cor- rélation entre le niveau de ces résidus lorsque l’on considère un individu
donné. En revanche, sous (H3 ), il n’existe pas de corrélation de ces résidus dans
la dimension inter individuelle.

    Quelles sont alors les conséquences de cette structure des résidus ? Si l’on raisonne
en termes de biais d’estimation, il n’y en a aucune dès lors que l’on centre les variables
du modèle sur leur moyenne respective. En e¤et, dans ce cas la composante individuelle
des résidus disparaît et les corrélations inter-individuels des résidus du modèle
transformé disparaissent par la même occasion. Pour le vecteur ¯; on retrouve
alors la forme générale de l’estimateur du modèle à e¤ets …xes. Pour preuve,
appliquons l’opérateur Q au modèle à e¤et aléatoire :

                             Qyi = Qe¹ + QXi ¯ + Qe®i +
                                        Qvi
                                                        ¡                                  ¢
                                                                                   ¡1
    Or, on sait par dé…nition de l’application que Qe = IT ¡ T                          ee0 e = 0: Dès
lors, on obtient le modèle 8 i 2 [1; N ] :

                               Qyi = Qe¹ + QXi ¯ + Qvi                                           (4.7)

   Dans ce modèle, sous (H3 ), l’estimateur ¯bLSDV du vecteur ¯ est non biaisé
                                            et
convergent 9 . L’estimateur de la constante ¹ est alors construit sous la forme :
                                                   0
                                  ¹ = y ¡ ¯b      x                                              (4.8)
                                    b        LSDV


avec :
                                  N   T                           N   T
                             1 XX                            1 XX
                     yi =                   yi;t       x =                  xi;t                 (4.9)
                     (1;1)   NT                    (K;1)     NT
                                  i=1 t=1                         i=1 t=1


    Ainsi, il n’existe pas de problème de biais lorsque l’on envisage les techniques d’es-
timation utilisées dans les modèles à e¤ets …xes, c’est à dire lorsque l’on centre
les
variables sur leurs moyennes individuelles respectives. Toutefois, l’estimateur
¯bLSDV
ainsi obtenu n’est pas un estimateur à variance minimale : c’est pas l’estimateur BLU E:

Proposition 4.2. Dans un modèle à e¤ets aléatoires, l’estimateur Within ¯bLSDV
                                                                         ;
obtenu sous l’hypothèse d’e¤ets …xes, est un estimateur sans biais et convergent
du vecteur de paramètres ¯: Toutefois, ce n’est pas l’estimateur BLU E. Un
estimateur BLU E est alors donné par l’estimateur de Moindres Carrés Généralisés
(MCG).
   9
       On a en e¤et :
                                                     p
                                           ¯b LS DV ¡! ¯
                                                  N T !1

où l’indice p désigne la convergence en probabilité (voir section précédente pour une démonstration).
Nous ne donnerons pas ici de démonstration de cette propriété. Si l’on résume,
quelle que soit la nature des e¤ets individuels (…xes ou aléatoires), l’estimateur Within
est un estimateur sans biais et convergent. Toutefois, cette estimateur n’est pas un
estimateur à variance minimale lorsque les e¤ets individuels sont aléatoires. Un
estimateur BLU E possible du vecteur ¯ est alors donné par l’estimateur de Moindres
Carrés Généralisés (MCG). Cette propriété sera particulièrement intéressante
lorsqu’il sera nécessaire de discriminer les deux modèles et de construire les tests de
spéci…cation appropriés (test d’Hausman 1978, en particulier).

4.3. Estimateur des Moindres Carrés Généralisés

Nous avons vu que dans un modèle à e¤ets aléatoires, un estimateur BLU E peut être
construit à partir de l’estimateur des Moindres Carrés Généralisés (MCG).
Considérons
le modèle vectoriel de la proposition (4.1) :

                                 yi = Xei ° + "i                              8 i = 1; ::; N
                                       (4.10)
avec "i = ®i e +vi
                                            ¡     ¢
;                  Xei = (e; Xi ) et ° 0 = ¹; ¯ 0 : Soit V la matrice de variance
                   covariance
du vecteur des résidus "i : V = E ("i "i0 ) : On suppose, dans un premier temps, que V
est connue. Le problème est que, du fait de la structure du modèle, la matrice V n’est
pas diagonale en raison de la présence de corrélations intra-individuelles des
résidus. Tout comme en séries temporelles, c’est pourquoi on applique alors les
MCG.

De…nition 4.3. Si la matrice V est connue, l’estimateur des MCG du vecteur °;
noté
°M
b
G     C;   est alors dé…ni par la relation :
                                    "                 #¡1 "               #
                                      N                     N
                                     X                     X
                         °M C G =
                         b               Xe 0 V 1 e
                                          i
                                                ¡
                                                              Xi 0 V ¡
                                                               e      1                  (4.11)
                                     i=1 Xi               i=1 yi


                                     °M C G
     Cette dé…nition de l’estimateur b      correspond à la dé…nition générale (iden-

tique à celle utilisée en série temporelle, cf. Bourbonnais 2000) des Moindres
Carrés Généralisés.     Bien entendu, lorsque la matrice V n’est pas connue,   b
l’estimateur ° M C G est obtenu en deux étapes. La première étape consiste à appliquer
l’estimateur W ithin
pour obtenir une première estimation sans biais et convergente des paramètres ¯
et
¹: A partir de ces estimations, on construit les séries de résidus individuels "i et
l’on
construit un estimateur         Vb
de la matrice de variance covariance V: La seconde étape
consiste alors à appliquer l’estimateur des MCG selon la formule (4.11) en utilisant
l’estimateur    de V:
Vb



    Il existe une autre façon d’obtenir l’estimateur des MCG. En e¤et, dans la pratique,
la procédure en deux étapes, utilisée dans les principaux logiciels d’économétrie, n’est
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel
L’Econométrie des Données de Panel

Weitere ähnliche Inhalte

Was ist angesagt?

3 gestion-de_la_tr_sorerie[1]
3  gestion-de_la_tr_sorerie[1]3  gestion-de_la_tr_sorerie[1]
3 gestion-de_la_tr_sorerie[1]OULAAJEB YOUSSEF
 
Chapitre i : cours Ingénierie Financière
Chapitre i : cours Ingénierie FinancièreChapitre i : cours Ingénierie Financière
Chapitre i : cours Ingénierie FinancièreLotfi TALEB, ESSECT
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulProfesseur Falloul
 
économie monétaire et financière s3
 économie monétaire et financière s3  économie monétaire et financière s3
économie monétaire et financière s3 mrmr rmrm
 
exercices corrigés état de flux de trésorerie.pdf
exercices corrigés état de flux de trésorerie.pdfexercices corrigés état de flux de trésorerie.pdf
exercices corrigés état de flux de trésorerie.pdfMLAYAHNoura
 
Gestion de tresorerie_m.naciri_mfi17+m2_daf
Gestion de tresorerie_m.naciri_mfi17+m2_dafGestion de tresorerie_m.naciri_mfi17+m2_daf
Gestion de tresorerie_m.naciri_mfi17+m2_dafezanjean
 
Donnees de panel
Donnees de panelDonnees de panel
Donnees de panelzizou36
 
Audit fiscal cours/1er Chapitre: Démarche de l'Audit Fiscal
Audit fiscal cours/1er Chapitre: Démarche de l'Audit FiscalAudit fiscal cours/1er Chapitre: Démarche de l'Audit Fiscal
Audit fiscal cours/1er Chapitre: Démarche de l'Audit Fiscalbouchra elabbadi
 
Principes comptables et normes internationales
Principes comptables et normes internationales Principes comptables et normes internationales
Principes comptables et normes internationales bouchra elabbadi
 
Cours analyse-financiere s4
Cours analyse-financiere s4Cours analyse-financiere s4
Cours analyse-financiere s4Fatima EzzahRa
 
Consolidation 2 : Homogénéisation
Consolidation 2 : HomogénéisationConsolidation 2 : Homogénéisation
Consolidation 2 : HomogénéisationStephane Lefrancq
 
Gestion de portefeuille
Gestion de portefeuilleGestion de portefeuille
Gestion de portefeuilleDalal Alami
 
Gestion budgétaire
Gestion budgétaire Gestion budgétaire
Gestion budgétaire hassan1488
 
Présentation des marché de capitaux
Présentation des marché de capitauxPrésentation des marché de capitaux
Présentation des marché de capitauxNovencia Groupe
 
value at risk
value at riskvalue at risk
value at riskamine145
 
La gestion collective
La gestion collectiveLa gestion collective
La gestion collectiveSouleey
 

Was ist angesagt? (20)

3 gestion-de_la_tr_sorerie[1]
3  gestion-de_la_tr_sorerie[1]3  gestion-de_la_tr_sorerie[1]
3 gestion-de_la_tr_sorerie[1]
 
Chapitre i : cours Ingénierie Financière
Chapitre i : cours Ingénierie FinancièreChapitre i : cours Ingénierie Financière
Chapitre i : cours Ingénierie Financière
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr Falloul
 
économie monétaire et financière s3
 économie monétaire et financière s3  économie monétaire et financière s3
économie monétaire et financière s3
 
exercices corrigés état de flux de trésorerie.pdf
exercices corrigés état de flux de trésorerie.pdfexercices corrigés état de flux de trésorerie.pdf
exercices corrigés état de flux de trésorerie.pdf
 
Marche de change
Marche de changeMarche de change
Marche de change
 
Gestion de tresorerie_m.naciri_mfi17+m2_daf
Gestion de tresorerie_m.naciri_mfi17+m2_dafGestion de tresorerie_m.naciri_mfi17+m2_daf
Gestion de tresorerie_m.naciri_mfi17+m2_daf
 
Donnees de panel
Donnees de panelDonnees de panel
Donnees de panel
 
Audit fiscal cours/1er Chapitre: Démarche de l'Audit Fiscal
Audit fiscal cours/1er Chapitre: Démarche de l'Audit FiscalAudit fiscal cours/1er Chapitre: Démarche de l'Audit Fiscal
Audit fiscal cours/1er Chapitre: Démarche de l'Audit Fiscal
 
Principes comptables et normes internationales
Principes comptables et normes internationales Principes comptables et normes internationales
Principes comptables et normes internationales
 
Cours analyse-financiere s4
Cours analyse-financiere s4Cours analyse-financiere s4
Cours analyse-financiere s4
 
Monnaie
MonnaieMonnaie
Monnaie
 
L'analyse financière
L'analyse financière  L'analyse financière
L'analyse financière
 
Consolidation 2 : Homogénéisation
Consolidation 2 : HomogénéisationConsolidation 2 : Homogénéisation
Consolidation 2 : Homogénéisation
 
Gestion de portefeuille
Gestion de portefeuilleGestion de portefeuille
Gestion de portefeuille
 
Gestion budgétaire
Gestion budgétaire Gestion budgétaire
Gestion budgétaire
 
Présentation des marché de capitaux
Présentation des marché de capitauxPrésentation des marché de capitaux
Présentation des marché de capitaux
 
value at risk
value at riskvalue at risk
value at risk
 
Gestion de tresorerie
Gestion de tresorerieGestion de tresorerie
Gestion de tresorerie
 
La gestion collective
La gestion collectiveLa gestion collective
La gestion collective
 

Andere mochten auch

STATA - Panel Regressions
STATA - Panel RegressionsSTATA - Panel Regressions
STATA - Panel Regressionsstata_org_uk
 
Formation spss mars 2013
Formation spss mars 2013Formation spss mars 2013
Formation spss mars 2013Ahmed Tbc
 
Cours panel-consommateurs
Cours panel-consommateursCours panel-consommateurs
Cours panel-consommateursantilaman
 
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-marocantilaman
 
Amélie lemieux tp- rep2400
Amélie lemieux  tp- rep2400Amélie lemieux  tp- rep2400
Amélie lemieux tp- rep2400Amelie Lemieux
 
Actualités mobiles iOS8 / Android L - Juillet 2014
Actualités mobiles iOS8 / Android L - Juillet 2014Actualités mobiles iOS8 / Android L - Juillet 2014
Actualités mobiles iOS8 / Android L - Juillet 2014Damien Laureaux
 
Nuit Et Brouillard J Ferrat M
Nuit Et Brouillard J Ferrat MNuit Et Brouillard J Ferrat M
Nuit Et Brouillard J Ferrat Mguestc3c970
 
Satellitrecorder4000 Om Grundig De
Satellitrecorder4000 Om Grundig DeSatellitrecorder4000 Om Grundig De
Satellitrecorder4000 Om Grundig Deguestd57a0a
 
Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)
Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)
Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)wusternberg
 
Vakoo handyhülle iphone 6 6s hülle
Vakoo handyhülle iphone 6 6s hülleVakoo handyhülle iphone 6 6s hülle
Vakoo handyhülle iphone 6 6s hülleMonicakic
 
PIERRE COUBERTIN
PIERRE COUBERTINPIERRE COUBERTIN
PIERRE COUBERTINEscomay
 
Tome 1 : L'acces aux services publics
Tome 1 : L'acces aux services publicsTome 1 : L'acces aux services publics
Tome 1 : L'acces aux services publicsparoles d'élus
 

Andere mochten auch (20)

STATA - Panel Regressions
STATA - Panel RegressionsSTATA - Panel Regressions
STATA - Panel Regressions
 
Formation spss mars 2013
Formation spss mars 2013Formation spss mars 2013
Formation spss mars 2013
 
Econométrie par : www.lfaculte.com
Econométrie par : www.lfaculte.comEconométrie par : www.lfaculte.com
Econométrie par : www.lfaculte.com
 
Manuel sphinx
Manuel sphinxManuel sphinx
Manuel sphinx
 
Correlation econometrie
Correlation econometrieCorrelation econometrie
Correlation econometrie
 
Cours panel-consommateurs
Cours panel-consommateursCours panel-consommateurs
Cours panel-consommateurs
 
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
 
Generalites econometrie
Generalites econometrieGeneralites econometrie
Generalites econometrie
 
Amélie lemieux tp- rep2400
Amélie lemieux  tp- rep2400Amélie lemieux  tp- rep2400
Amélie lemieux tp- rep2400
 
Joab
JoabJoab
Joab
 
Kerr Dissertation
Kerr DissertationKerr Dissertation
Kerr Dissertation
 
Actualités mobiles iOS8 / Android L - Juillet 2014
Actualités mobiles iOS8 / Android L - Juillet 2014Actualités mobiles iOS8 / Android L - Juillet 2014
Actualités mobiles iOS8 / Android L - Juillet 2014
 
Nuit Et Brouillard J Ferrat M
Nuit Et Brouillard J Ferrat MNuit Et Brouillard J Ferrat M
Nuit Et Brouillard J Ferrat M
 
estado y sociedad
estado y sociedadestado y sociedad
estado y sociedad
 
Satellitrecorder4000 Om Grundig De
Satellitrecorder4000 Om Grundig DeSatellitrecorder4000 Om Grundig De
Satellitrecorder4000 Om Grundig De
 
Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)
Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)
Wieviel Gebet ErhöRt Gott (Format Powerpoint 2007)
 
Vakoo handyhülle iphone 6 6s hülle
Vakoo handyhülle iphone 6 6s hülleVakoo handyhülle iphone 6 6s hülle
Vakoo handyhülle iphone 6 6s hülle
 
PIERRE COUBERTIN
PIERRE COUBERTINPIERRE COUBERTIN
PIERRE COUBERTIN
 
Mosques2
Mosques2Mosques2
Mosques2
 
Tome 1 : L'acces aux services publics
Tome 1 : L'acces aux services publicsTome 1 : L'acces aux services publics
Tome 1 : L'acces aux services publics
 

Ähnlich wie L’Econométrie des Données de Panel

Panel talnan touk(1)
Panel talnan touk(1)Panel talnan touk(1)
Panel talnan touk(1)alex touk
 
Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_mohamedchaouche
 
Cours 20de-20simulation
Cours 20de-20simulationCours 20de-20simulation
Cours 20de-20simulationJihad Makhlouf
 
recherche operationnelle
recherche operationnelle recherche operationnelle
recherche operationnelle mohamednacim
 
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...MohamedAmineHACHICHA1
 
Mathematiques _resumes_du_cours
Mathematiques  _resumes_du_coursMathematiques  _resumes_du_cours
Mathematiques _resumes_du_coursahmed jafour
 
modele destimation.pptx
modele destimation.pptxmodele destimation.pptx
modele destimation.pptxzahrakmar
 
Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...
Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...
Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...Saïd Bolgot
 
cours logiciels de simulation.docx
cours logiciels de simulation.docxcours logiciels de simulation.docx
cours logiciels de simulation.docxssuser0dbd4e
 
Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)
Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)
Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)Mohammed TAMALI
 
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdfJeanPhilippeTurcotte5
 
Poly-Cours-Methodes-Elements-Finis-V4.pdf
Poly-Cours-Methodes-Elements-Finis-V4.pdfPoly-Cours-Methodes-Elements-Finis-V4.pdf
Poly-Cours-Methodes-Elements-Finis-V4.pdfssuserb8c51c
 
Article: Qu'est-ce que le R&R?
Article: Qu'est-ce que le R&R?Article: Qu'est-ce que le R&R?
Article: Qu'est-ce que le R&R?Infodream
 

Ähnlich wie L’Econométrie des Données de Panel (20)

Panel talnan touk(1)
Panel talnan touk(1)Panel talnan touk(1)
Panel talnan touk(1)
 
Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_Cours d econometrie_professeur_philippe_deschamps_edition_
Cours d econometrie_professeur_philippe_deschamps_edition_
 
Cours 20de-20simulation
Cours 20de-20simulationCours 20de-20simulation
Cours 20de-20simulation
 
Bourguet2
Bourguet2Bourguet2
Bourguet2
 
Chapitre 1
Chapitre 1Chapitre 1
Chapitre 1
 
recherche operationnelle
recherche operationnelle recherche operationnelle
recherche operationnelle
 
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
Calibration de modèles d'agents de marchés financiers par une démarche d'infé...
 
Mathematiques _resumes_du_cours
Mathematiques  _resumes_du_coursMathematiques  _resumes_du_cours
Mathematiques _resumes_du_cours
 
Recherches opérationnelles
Recherches opérationnellesRecherches opérationnelles
Recherches opérationnelles
 
Rapport
RapportRapport
Rapport
 
modele destimation.pptx
modele destimation.pptxmodele destimation.pptx
modele destimation.pptx
 
Prog lin
Prog linProg lin
Prog lin
 
Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...
Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...
Réseaux de neurones, lissage de la fonction d'actualisation et prévision des ...
 
cours logiciels de simulation.docx
cours logiciels de simulation.docxcours logiciels de simulation.docx
cours logiciels de simulation.docx
 
Manuel uml-poweramc
Manuel uml-poweramcManuel uml-poweramc
Manuel uml-poweramc
 
Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)
Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)
Chap XI : Outils de Simulation des modes opératoires (Plans d’expériences)
 
Regsimple
RegsimpleRegsimple
Regsimple
 
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
 
Poly-Cours-Methodes-Elements-Finis-V4.pdf
Poly-Cours-Methodes-Elements-Finis-V4.pdfPoly-Cours-Methodes-Elements-Finis-V4.pdf
Poly-Cours-Methodes-Elements-Finis-V4.pdf
 
Article: Qu'est-ce que le R&R?
Article: Qu'est-ce que le R&R?Article: Qu'est-ce que le R&R?
Article: Qu'est-ce que le R&R?
 

L’Econométrie des Données de Panel

  • 1. L’Econométrie des Données de Panel Modèles Linéaires Simples
  • 2. L’Econométrie des Données de Panel 2 Figure 0.1: Présentation Le but de ce séminaire est de proposer une initiation, tant sur le plan théorique que sur le plan appliqué, à l’économétrie des données de panel. Sur le plan théorique, le séminaire débutera par une présentation des problèmes de spéci…cations de base en économétrie de panel et par les méthodes d’estimation traditionnelles. Cette première partie insistera en particulier sur les stratégies de tests de spéci…cation du modèle. La seconde partie du séminaire sera consacrée à l’étude des panels dynamiques et pro- posera une introduction aux concepts de non stationnarité stochastique en panel et notamment à la spéci…cation des tests de non stationnarité et de cointégration. Ces concepts théoriques seront appliqués à di¤érentes problématiques économiques, comme par exemple la problématique de la convergence des PIB par tête, que ce soit au travers de commentaires de travaux empiriques ou par la programmation d’exemples illustratifs sous un logiciel d’économétrie (TSP ou SAS à préciser)
  • 3. L’Econométrie des Données de Panel 3 Table des Matières Introduction 2 Chapitre 1 : Modèles Linéaires Simples 5 Introduction 6 1. Tests de spéci…cation ou tests d’homogénéité 8 1.1. L’exemple d’une fonction de production 8 1.2. Procédure de tests de spéci…cation 10 1.2.1. Procédure générale 10 1.2.2. Construction des statistiques de test 13 1.3. Application 17 2. Modèles à e¤ets individuels 20 2.1. Empilement par pays 21 2.1.1. Exemple 22 2.2. Empilement par dates 23 2.2.1. Exemple 23 3. Modèles à e¤ets …xes 25 3.1. Estimateur Within ou LSDV 26 3.2. Application 28 3.3. Ecriture vectorielle 31 4. Modèles à e¤ets aléatoires 33 4.1. Modèle à variance composée 34 4.2. Estimateurs du modèle à e¤ets aléatoires 35 4.3. Estimateur des Moindres Carrés Généralisés 37 4.4. Application 42 5. Tests de spéci…cation des e¤ets individuels 44 5.1. Corrélation des e¤ets individuels et des variables explicatives 45 5.2. Test de spéci…cation d’Hausman 49 6.3. Application 51 6. Modèles à coe¢cients …xes et aléatoires 53 6.1. Modèle MFR de Hsiao (1989) 53 6.2. Méthode d’estimation des paramètres 56 6.3. Application 57
  • 4. L’Econométrie des Données de Panel 4 Annexes 62 A.1. Equivalence entre les estimateurs Within et pooled à = 1 62 : A.2. Programme TSP : Modèle MFR 63 Bibliographie 67
  • 5. L’Econométrie des Données de Panel 5 Chapitre I Modèles Linéaires Simples
  • 6. L’Econométrie des Données de Panel 6 Introduction Dans ce premier chapitre, nous nous restreindrons à l’étude des modèles linéaires sim- ples sur données de panel, ces derniers étant dé…nis par opposition aux modèles dy- namiques faisant intervenir des variables endogènes retardées. Dans toute la suite de ce chapitre, on considère des processus strictement stationnaires au sens de la stationnarité du second ordre1 . L’objectif des cinq premières sections de ce chapitre est de faire en sorte que le lecteur puisse interpréter, de façon exhaustive et relativement approfondie, les résultats de base que donnent les principaux logiciels d’économétrie lorsque l’on envisage des modèles de panel. Nous prendrons ici comme référence le logiciel TSP 4.3, mais il est bien entendu évident que ces résultats de base sont sensiblement identiques si l’on considère d’autres logiciels comme Eviews, SAS ou Rats. Quelles sont les connaissances minimales nécessaires à l’économètre appliqué pour pouvoir interpréter un tableau de résultats d’estimation de panel ? Prenons comme exemple la commande panel de TSP. A l’issue de cette procédure, l’utilisateur dispose des réalisations des estimateurs Pooled, Between, des estimateurs du modèle à e¤ets individuels …xes (Within ), du modèle à e¤ets individuels aléatoires (Error Component Model ), des résultats de trois tests de Fischer, d’un estimateur de la variance des e¤ets individuels, d’un estimateur de la variance totale, de l’estimateur d’un paramètre de pondération et de la statistique du test d’Hausman. Voilà ainsi résumés tous les élements que nous nous proposons d’étudier tout au long des cinq premières sections. Ainsi, la première section est consacrée aux tests de spéci…cation qui correspondent en fait aux trois tests de Fischer du …chier de résultat des estimations TSP. Il s’agit ici de déterminer la manière dont doit être spéci…é un modèle de panel, si tant que l’hypothèse de panel puisse être acceptée. Nous verrons alors que toute l’analyse repose alors sur la notion d’homogénéité des paramètres du modèle envisagé. Les tests présentés visent ainsi à porter un diagnostic sur l’éventuelle nécessité d’intégrer une dimension hétérogène et sur la manière dont cette hétérogénéité doit être spéci…ée. Une des manières simples pour ne pas supposer l’existence d’un modèle totalement identique consiste ainsi à introduire des e¤ets individuels sous la forme de constantes spéci…ques, propres à chaque individu du panel. Nous proposerons ainsi une procédure générale de tests de spéci…cation des modèles linéaires simples. 1 La dé…nition de la stationnarité fera l’ob jet du chapitre suivant.
  • 7. L’Econométrie des Données de Panel 7 Dans une seconde section, nous présenterons le modèle à e¤ets individuels. Ce modèle suppose l’existence de coe¢cients identiques pour tous les individus et de con- stantes spéci…ques. Ainsi, la relation économique mise en évidence à travers ce type de modélisation n’est censée di¤érer pour tous les individus qu’au niveau des constantes introduites dans le modèle. Nous insisterons alors sur la construction du modèle et en particulier sur sa représentation sous forme vectorielle. Il s’agit ici de présenter les deux principales méthodes de construction des échantillons de données, à savoir la méthode d’empilement par date et la méthode d’empilement par individus. La troisième section est consacré au modèle à e¤ets individuels …xes. On suppose dans cette section que les e¤ets individuels sont des paramètres déterministes. Nous serons alors amener à présenter la construction et les propriétés de l’estimateur Within des coe¢cients du modèle. Une application sur les relations entre le nombre de grèves dans le secteur industriel et les déterminants macroéconomiques sera proposée. Nous nous appuierons sur les résultats et les di¤érents tests proposés sous TSP. Une quatrième section sera consacrée au modèle à e¤ets individuels aléatoires. On suppose dans cette section que les e¤ets individuels ne sont plus des paramètres, mais des variables aléatoires possédant une distribution commune pour tous les individus. Nous commencerons par étudier la structure des résidus de ce modèle à variance com- posée. Nous étudierons ensuite les di¤érents estimateurs des coe ¢cients du modèle à e¤ets aléatoires et plus particulièrement l’estimateur des Moindres Carrés Généralisés. En…n, la cinquième section sera consacrée aux tests de spéci…cation des e¤ets indi- viduels. La question est alors de savoir quel modèle, parmi les modèles à e¤ets aléatoires et e¤ets …xes, doit être retenu. Ceci nous conduira à présenter le test d’Hausman (1978) qui constitue le test standard de spéci…cation des e¤ets individuels. Nous conclurons en…n en introduisant un sixième section consacrée à la présentation d’un type de modèle de plus en plus utilisé en économétrie appliqué : le modèle avec coe¢cients …xes et coe¢cients aléatoires. Ce modèle, introduit notamment par Hsiao (1989), permet de réaliser di¤érents exercices de modélisation économique particulière- ment intéressants.
  • 8. L’Econométrie des Données de Panel 8 1. Tests de spéci…cation ou tests d’homogénéité Lorsque l’on considère un échantillon de données de panel, la toute première chose qu’il convient de véri…er est la spéci…cation homogène ou hétérogène du processus générateur de données. Sur le plan économétrique, cela revient à tester l’égalité des coe¢cients du modèle étudié dans la dimension individuelle. Sur le plan économique, les tests de spéci…cation reviennent à déterminer si l’on est en droit de supposer que le modèle théorique étudié est parfaitement identique pour tous les pays, ou au contraire s’il existe des spéci…cités propres à chaque pays. Nous commencerons par présenter un petit exemple illustratif construit à partir d’une fonction de production agrégée. Dans une seconde section, nous généraliserons la procédure de tests de spéci…cation en introduisant les notions de variances intra- classes (Within ) et inter-classes (Between ). En…n, nous proposerons une application de ces tests de spéci…cation à l’estimation d’une relation entre le nombre de grèves et un ensemble de variables explicatives. 1.1. L’exemple d’une fonction de production Prenons l’exemple d’une fonction de production. Supposons que l’on dispose d’un échantillon de données de P I B et de facteurs (travail et capital) sur une durée de T périodes pour un ensemble de N pays. Si l’on note yi;t le logarithme du P I B, ki;t le logarithme du stock de capital privé et ni;t le logarithme de l’emploi et que l’on suppose une fonction de production de type Cobb Douglass, le modèle général s’écrit sous la forme 8 i 2 [1; N ] ; 8 t 2 [1; T ] : yi;t = ®i + ¯ i ki;t + ° i ni;t + "i;t Les innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance égale à ¾ 2 ; 8 i 2 [1; N ] : " Dans un premier temps, la phase de test de spéci…cation, revient sur le plan économique, à déterminer s’il est en droit de supposer une fonction de production totalement identique pour tous les pays (modèle pooled ). Dans ce cas, les élasticités de l’emploi et du capital sont identiques pour tous les pays (¯ i = ¯; ° i = °; 8 i 2 [1; N ] ) et le niveau moyen de la productivité totale des facteurs, représenté ici par les constantes ®i ; est lui aussi identique pour tous les pays. Le modèle s’écrit alors sous la forme : yi;t = ® + ¯ki;t + °ni;t + "i;t
  • 9. L’Econométrie des Données de Panel 9 Toutefois, lorsque l’on travaille sur des séries agrégés, il est relativement peu prob- able que la fonction de production macroéconomique soit strictement identique pour tous les pays étudiés. Si l’hypothèse d’homogénéité totale est rejetée, il convient alors de tester si les élasticités des di¤érents facteurs sont identiques. Si ce n’est pas le cas, il n’existe a priori aucune structure de production commune entre les pays. Dans ce cas, l’utilisation des données de panel ne se justi…e pas et peut même conduire à des biais d’estimation. On doit donc estimer les fonctions de production pays par pays. Si en revanche, il s’avère qu’il existe bien une relation identique entre la production et les facteurs pour tous les pays, la source d’hétérogénéité du modèle peut alors provenir des constantes ®i : Dans notre exemple, ces constantes représentent la moyenne de la productivité totale des facteurs de production (résidu de Solow). Or, rien ne garan- tit que les pays étudiés possèdent le même niveau de productivité structurelle. Au contraire, il se peut parfaitement que des facteurs a-temporels ou structurels, comme la position géographique, le climat, l’éloignement par rapport au grands axes commerciaux etc... aient pu conduire à des di¤érences structurelles de niveau de productivité entre les pays. Il convient donc de tester l’hypothèse d’une constante commune à tous les pays. Si cette hypothèse est rejetée, on obtient alors un modèle avec e¤ets individuels qui s’écrit sous la forme : yi;t = ®i + ¯ki;t + °ni;t + "i;t Dans ce cas, le niveau moyen de la productivité totale des facteurs, déterminé par E (®i + "i;t ) = ®i ; varie selon les pays, même si la structure de production (les élasticités des deux facteurs travail et capital) est identique. Cet exemple, que nous allons à présent généraliser, montre bien que la phase de test de spéci…cation revient à déterminer si le processus générateur de données peut être considéré comme homogène, c’est à dire unique pour tous les individus, ou si au contraire il apparaît totalement hétérogène, auquel cas l’utilisation des techniques de panel ne peut se justi…er. Entre ces deux cas extrêmes, il convient de précisément identi…er la source d’hétérogénéité pour bien spéci…er le modèle.
  • 10. L’Econométrie des Données de Panel 10 1.2. Procédure de tests de spéci…cation On considère un échantillon de T observations de N processus individuels fyi;t ; t 2 Z; i 2 Ng et fxi;t ; t 2 Z; i 2 Ng : Par la suite, on notera fyi;t g et fxi;t g ces deux processus. On suppose que le processus fyi;t g est dé…ni de façon générale par le relation linéaire suiv- ante, 8 i 2 N, 8 t 2 Z : yi;t = ®i + ¯i0 xi;t + "i;t (1.1) ¡ ¢ 0 où ®i 2 R, ¯ i = ¯ 1;i ¯ 2;i ::::¯ K;i est un vecteur de dimension (K; 1). On considère ainsi un vecteur de K variables explicatives : 0 xi;t = (x1;i;t ; x2;i;t ; :::; xK;i;t ) (1.2) Les innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance égale 2 à ¾" ; 8 i 2 [1; N ] : Ainsi on suppose que les paramètres ®i et ¯ i du modèle (1.1) peuvent di¤érer dans la dimension individuelle2 , mais l’on suppose qu’ils sont constants dans le temps. 1.2.1. Procédure générale Si l’on considère le modèle (1.1), plusieurs con…gurations sont alors possibles : 1. Les N constantes ®i et les N vecteurs de paramètres ¯ i sont identiques : ®i = ®; ¯ i = ¯ 8 i 2 [1; N ]. On quali…e alors le panel de panel homogène. 2. Les N constantes ®i et les N vecteurs de paramètres ¯ i sont di¤érents selon les individus. On a donc N modèles di¤érents, on rejette la structure de panel. 3. Les N constantes ®i sont identiques, ®i = ® 8 i 2 [1; N ] ; tandis que les vecteurs de paramètres ¯ i di¤èrent selon les individus. Dans ce cas, tous les coe¢cients du modèle, à l’exception des constantes, sont di¤érents selon les individus. On a donc N modèles di¤érents. 4. Les N vecteurs de paramètres ¯ i sont identiques, ¯ i = ¯ 8 i 2 [1; N ] ; tandis que les constantes ®i di¤èrent selon les individus. On obtient un modèle à e¤ets individuels. Pour discriminer ces di¤érentes con…gurations et pour s’assurer du bien fondé de la structure de panel, il convient d’adopter une procédure de tests d’homogénéité emboîtés. La procédure générale de test présentée dans Hsiao (1986) est décrite sur la … gure (1.1). 2 A l’exception de la variance des innovations que l’on supposera identique pour tous les individus.
  • 11. Figure 1.1: Procédure Générale de Tests d’Homogénéité 1 TestH 0 : i i i 1, N 1 H 0 rejetée H 1 vraie 0 2 TestH 0 : i i 1, yi,t ' xi,t i,t N 0 2 H 0 rejetée H 2 vraie 3 yi,t i i ' xi,t i,t TestH : i 1, N 0 i 3 H 0 vraie H 3 rejetée 0 yi,t ' xi,t i,t yi,t i ' xi,t i,t Dans une première étape, on teste l’hypothèse d’une structure parfaitement ho- mogène (constantes et coe¢cients identiques) : 1 H 0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N ] 1 H a : 9 (i; j) 2 [1; N ] = ¯ i = ¯ j ou ®i = ®j On utilise alors une statistique de Fischer pour tester ces (K + 1) (N ¡ 1) restric- tions linéaires3 . Si l’on suppose que les résidus "i;t sont indépendamment distribués dans les dimensions i et t; suivant une loi normale d’espérance nulle et de variance …nie ¾"2 ; cette statistique suit une distribution de Fischer avec (K + 1) (N ¡ 1) et N T ¡ N (K + 1) degrés de liberté. Les conclusions de ce test sont les 0 suivantes. Si l’on accepte l’hypothèse nulle H 1 d’homogénéité, on obtient alors un modèle de pooled totalement homogène. yi;t = ® + ¯ 0 xi;t + "i;t (1.3) Si en revanche, on rejette l’hypothèse nulle, on passe à une seconde étape qui consiste à déterminer si l’hétérogénéité provient des coe¢cients ¯ i . 3 Dans notre modèle, chaque vecteur ¯ i comprend K paramètres. Pour les N individus du panel,
  • 12. on obtient K N paramètres. L’égalité des N vecteurs ¯ i revient donc à imposer K N ¡ K restrictions. De la même façon, l’égalité des N constantes revient à imposer N ¡ 1 restrictions. Au total, l’hypothèse 1 H 0 revient à imposer (K + 1) (N ¡ 1) restrictions linéaires.
  • 13. La seconde étape consiste à tester l’égalité pour tous les individus des K com- posantes des vecteurs ¯ i . H02 : ¯ i = ¯8 i 2 [1; N ] H 2a : 9 (i; j) 2 [1; N ] = ¯ i = ¯j Sous l’hypothèse nulle, on n’impose ici aucune restriction sur les constantes indi- viduelles ®i : De la même façon, on construit une statistique de Fischer pour tester ces (N ¡ 1) K restrictions linéaires. Toujours sous l’hypothèse d’indépendance et de normalité des résidus, cette statistique suit une loi de Fischer avec (N ¡ 1) K et N T ¡ N (K + 1) degrés de liberté. Si l’on rejette l’hypothèse nulle 2 H 0 d’homogénéité des coef- …cients ¯ i , on rejette alors la structure de panel, puisque au mieux seules les constantes ®i peuvent être identiques entre les individus : yi;t = ® + ¯i0 xi;t + "i;t (1.4) On estime alors les paramètres vectoriels ¯ i en utilisant les modèles di¤érents pays par pays. Si en revanche, on accepte l’hypothèse nulle H20 d’homogénéité des coe ¢cients ¯ i ; on retient la structure de panel et l’on cherche alors à déterminer dans une troisième étape si les constantes ®i ont une dimension individuelle. La troisième étape de la procédure consiste à tester l’égalité des N constantes indi- viduelles ®i ; sous l’hypothèse de coe¢cients ¯ i communs à tous les individus : 3 H0 : ®i = ® 8 i 2 [1; N ] 3 H a : 9 (i; j) 2 [1; N ] = ®i = ®j Sous l’hypothèse nulle, on impose ¯ i = ¯: Sous l’hypothèse d’indépendance et de normalité des résidus, on construit une statistique de Fischer pour tester ces N ¡ 1 restrictions linéaires. Cette statistique suit une loi de Fischer avec (N ¡ 1) K et N (T ¡ 1) ¡ K degrés de liberté. Si l’on rejette l’hypothèse nulle H 0 d’homogénéité 3 des constantes ®i , on obtient alors un modèle de panel avec e¤ets individuels : yi;t = ®i + ¯ 0 xi;t + "i;t (1.5) Dans le cas où l’on accepte l’hypothèse nulle H30 , on retrouve alors une structure de 0 panel totalement homogène (modèle pooled ). Le test H 3 ne sert alors qu’à con… 0 rmer ou in…rmer les conclusions du 1tests H ; étant donné que le fait de réduire le nombre de restrictions linéaires permet d’accroître la puissance du test du Fischer.
  • 14. 1.2.2. Construction des statistiques de test Nous allons à présent, présenter les méthodes de construction des di¤érents tests de Fischer utilisés dans cette procédure. On considère le modèle (1.1) et l’on suppose que les résidus "i;t sont indépendamment distribués dans les dimensions i et t; suivant une loi normale d’espérance nulle et de variance …nie ¾ 2 . On suppose que la variance ¾2 est " " connue. Test d’homogénéité globale On considère tout d’abord, le test de l’hypothèse d’homogénéité totale H 01 : 1 H 0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N ] Soit F1 la statistique de Fischer associée à ce test. Ce test revient à imposer (K + 1) (N ¡ 1) restrictions linéaires sur les coe¢cients du modèle (1.1). De plus, sous l’hypothèse alternative H 2 ; il existe au plus N K coe¢cients di¤érents a pour les composantes des N vecteurs ¯ i (de dimension K) et N constantes individuelles. On dispose donc de N T ¡ N (K + 1) degrés de liberté. De…nition 1.1. La statistique de Fischer F1 associée au test d’homogénéité totale H01 dans le modèle (1.1) : 1 H0 : ¯ i = ¯ ®i = ® 8 i 2 [1; N ] (K;1) s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1) (K + 1) et N T ¡N (K + 1) degrés de liberté : (SCR1;c ¡ SCR1 ) = [(N ¡ 1) (K + 1)] F1 = (1.6) SCR1 = [N ¡ N (K + 1)] T où SC R1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c la somme des carrés des résidus du modèle contraint : yi;t = ® + ¯ 0 xi;t + "i;t Ainsi, si la réalisation de la statistique de Fischer pour l’échantillon considéré est supérieure au seuil théorique à ®%; on rejette l’hypothèse nulle d’homogénéité. Reste à présent à déterminer la formule générale des sommes de carrés des résidus des modèles contraint et non contraint. Considérons tout d’abord le modèle non contraint : yi;t = ®i + ¯ 0i xi;t + "i;t Les estimateurs ¯bi e®i des paramètres individuels sont obtenus équation par équa- t b
  • 15. tion pour chaque individu. Soit SCR1;i la somme des carrés des résidus obtenue pour
  • 16. chaque équation. La somme des carrés des résidus du modèle (1.1) non contraint est alors tout simplement dé…nie comme la somme des N somme des carrés des résidus obtenues pour les N équations individuelles. X N X N h i 0 ¡1 SCR1 = SCR1;i = Syy;i ¡ xy;iSxx;i Sxy;i (1.7) S i=1 i=1 où les sommes Sk;i sont dé…nies de la façon suivante 8 i 2 [1; N ] : X T 2 Syy;i = (yi;t ¡ yi ) (1.8) t=1 X T 0 Sxx;i = (xi;t ¡ xi ) (xi;t ¡ xi ) (1.9) t=1 X T 0 Sxy;i = (xi;t ¡ xi ) (yi;t ¡ y i ) (1.10) t=1 Les moyennes xi et yi sont dé…nies, pour chaque individu, dans la dimension tem- porelle de façon traditionnelle par 8 i 2 [1; N ] : T 1X xi = xi;t T t=1 T 1X yi = yi;t T t=1 L’expression de SCR1 fait ainsi apparaître la somme des variances individuelles des résidus obtenues à partir des N régressions individuelles. L’expression Syy;i ¡ ¡1 Sxy;i Sxx;i Sxy;i correspond ainsi (à une transformée linéaire près) à la variance intra- 0 groupe (Within variance) des résidus. Le modèle (1.1) contraint sous l’hypothèse H01 s’écrit : yi;t = ® + ¯ 0 xi;t + "i;t (1.11) On dispose ainsi d’un échantilon de T N observations pour identi…er les paramètres communs ® et ¯ de cette relation. On applique alors les Moindres Carrés Ordinaires sur les données empilées (modèle pooled). La somme des carrés s’écrit sous la forme : SC R1;c = Syy ¡ S 0 Sxx Sxy xy ¡1 (1.12) où les sommes Sk sont dé…nies de la façon suivante : N T
  • 17. XX 2 Syy = (yi;t ¡ y i ) (1.13) i=1 t=1
  • 18. XX N T 0 Sxx;i = (xi;t ¡ xi ) (xi;t ¡ xi ) (1.14) i=1 t=1 XX N T 0 Sxy;i = (xi;t ¡ xi ) (yi;t ¡ y i ) (1.15) i=1 t=1 Les moyennes x et y sont alors dé…nies sur l’ensemble des T N observations : 1 XX N T x= xi;t NT i=1 t=1 1 XX N T y= yi;t NT i=1 t=1 L’expression SCR1;c correspond à une transformée de la variance totale des résidus (total variance) obtenus à partir de l’estimation d’un modèle unique sur les N T données empilées. Test d’homogénéité des coe¢cients ¯ i Considérons à présent le test de l’hypothèse d’homogénéité des coe¢cients ¯ i , notée 2 H0 : 2 H0 : ¯ i = ¯ 8 i 2 [1; N ] Soit F2 la statistique de Fischer associée à ce test. Sous l’hypothèse nulle, on n’im- pose aucune restriction sur les constantes individuelles ®i : Toujours sous l’hypothèse d’indépendance et de normalité des résidus, on construit une statistique de Fischer pour tester ces (N ¡ 1) K restrictions linéaires. aSous l’hypothèse alternative H 2 ; on retrouve le modèle (1.1) et N T ¡ N (K + 1) degrés de liberté. De…nition 1.2. La statistique de Fischer F2 associée au test d’homogénéité totale H02 dans le modèle (1.1) : 2 H 0 : ¯i = ¯ 8 i 2 [1; N ] (K;1) s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1) K et N T ¡ N (K + 1) degrés de liberté : ¡ ¢ SC R1;c0 ¡ SCR1 = [(N ¡ 1) K] F2 = (1.16) SCR1 = [N ¡ N (K + 1)] T où SCR1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c0 la somme des carrés des résidus du modèle contraint (modèle à e¤ets individuels) : yi;t = ®i + ¯ 0 xi;t + "i;t
  • 19. La somme des carrés des résidus du modèle non contraint, SC R1 ; est donnée par l’équation (1.7). Sous l’hypothèse H02 ; la somme des carrés des résidus dans le modèle à e¤ets individuels est donnée par : à !0 à !¡1 à ! X N X N X N XN SC R1;c0 = Syy;i ¡ Sxy;i Sxx;i Sxy;i (1.17) i=1 i=1 i=1 i=1 où les sommes Sk;i ont été dé…nies par les équations (1.8), (1.9) et (1.10). Cette écriture signi…e que dans le modèle à e¤ets individuels, les estimateurs (Within ) des paramètres ¯ i et ®i sont obtenus en centrant les variables sur leurs moyennes individuelles respec- tives. Nous reviendrons par la suite sur cette propriété. Test d’homogénéité des constantes ®i Considérons en…n le dernier test d’homogénéité des constantes ®i , notée H03 : 3 H0 : ®i = ® 8 i 2 [1; N ] Soit F3 la statistique de Fischer associée à ce test. Sous l’hypothèse nulle, on impose l’égalité des paramètres ¯ i : Sous l’hypothèse d’indépendance et de normalité des résidus, on construit une statistique de Fischer pour tester ces N ¡ 1 restrictions linéaires. Sous l’hypothèse alternative Ha3 ; les coe¢cients ¯ i sont tous égaux, mais les constantes di¤èrent selon les individus. On a donc N T ¡ N ¡ K degrés de liberté. De…nition 1.3. La statistique de Fischer F3 associée au test d’homogénéité totale H03 dans le modèle (1.1) : 3 H 0 : ®i = ® 8 i 2 [1; N ] s’écrit sous la forme suivante et suit un Fischer avec N ¡ 1 et N (T ¡ 1) ¡ K degrés de liberté : ¡ ¢ SCR1;c ¡ SCR1;c0 = (N ¡ 1) F3 = (1.18) SC R1;c0= [N (T ¡ ¡ K] 1) où SC R1;c0 désigne la somme des carrés des résidus du modèle (1.1) sous l’hypothèse ¯ i = ¯ (modèle à e¤ets individuels) et SCR1;c la somme des carrés des résidus du modèle contraint (modèle de pooled) : yi;t = ® + ¯ 0 xi;t + "i;t Les sommes des carrés des résidus SCR1;c0 et SC R1;c ont été respectivement dé… nies par les équations (1.17) et (1.12). Il est en outre possible de tester la constance dans le temps des di¤érents paramètres du panel suivant une procédure sensiblement identique (voir Hsiao 1986). Mais cette problématique relève plus de la notion traditionnelle de stabilité des coe ¢cients dans le temps que de la pure application des techniques économétriques de
  • 21. 1.3. Application Considérons à présent une application simple de ces tests d’homogénéité à partir de données de panel relatives au nombre de grèves dans le secteur industriel4 . Les données annuelles couvrent 17 pays5 de l’OCDE et sont disponibles de 1951 à 1985. Soit si;t le nombre de jours chômés pour cause de grève, pour 1000 salariés du secteur industriel, du pays i observé à la date t. Nous cherchons à relier cette variable d’une part au taux de chômage de l’économie, noté ui;t ; et d’autre au niveau de l’in‡ation, notée pi;t ; selon la relation linéaire suivante : si;t = ®i + ¯ i ui;t + ° i pi;t + "i;t 8 i = 1; ::; 17 (1.19) Appliquons la stratégie de test d’homogénéité à ce modèle. Pour ce faire, nous utiliserons directement les résultats des tests programmés sous TSP (version 4.3A ou versions ultérieures). Les commandes TSP sont donc les suivantes : load(file=’’strikes.wks’’); panel (id=i,time=t,byid) srt u p; La première ligne du programme sert tout simplement à lire les données du …chier strike.wks. La seconde ligne du programme permet d’obtenir l’ensemble des estima- teurs de base (pooled, between, e¤ets …xes et e¤ets aléatoires) ainsi que les résultats des principaux tests de spéci…cation (tests d’homogénéité et test d’Hausman). L’option id = i indique le nom de l’indicatrice pays et l’option time = t indique le nom de l’indi- catrice temporelle. L’option byid est nécessaire pour a ¢cher l’ensemble des résultats des tests de spéci…cation6 . Les variables sont respectivement nommées srt , u et p. Sur la …gure (1.2) sont reportés les résultats d’estimation de cette procédure TSP. Nous allons nous concentrer plus particulièrement sur l’analyse des résultats des tests d’homogénéité. TSP propose, avec l’option byid, les trois tests de Fischer présentés précédemment. On observe tout d’abord le panel est cylindré (balanced), c’est à dire qu’il comporte le même nombre de points dans la dimension temporelle pour tous les individus. On a ici N = 17 et T = 35; soit 595 observations. Commençons tout d’abord par le test 4 Les données ont été collectées par Bruce Western et proviennent du site http://lib.stat.cmu.edu/datasets/ 5 Le panel comporte initialement 18 pays, mais pour le pays 3, les données ne sont disponibles que jusqu’en 1980. C’est pourquoi a…n de travailler sur un panel cylindré nous avons choisi de retirer ce pays de notre échantillon. 6 Pour plus de détails sur l’instruction panel sous TSP, se reporter au manuel de programmation du logiciel.
  • 22. Figure 1.2: Résultats des Tests de Spéci…cation sous TSP 4.3A
  • 23. de l’hypothèse d’homogénéité totale (test H 1 dans nos notations). Ce dernier est 0 noté sous la forme F test of A; B = Ai ; Bi dans le …chier résultat de TSP. La lettre A désigne ici les constantes, tandis que la lettre B désigne le vecteur des coe ¢cients des variables explicatives. Dans le cadre de notre échantillon, la réalisation de 1 la statistique de Fischer associée au test H 0 , notée F1 ; est de 3:8320. Le logiciel indique en outre le nombre de degré de liberté de cette statistique. Nous avons vu précédemment que F1 suivait un Fischer avec (N ¡ 1) (K + 1) et N T ¡ N (K + 1) degrés de liberté. Compte tenu des dimensions de notre panel et du nombre de variables explicatives (K = 2), on doit donc comparer la valeur de cette réalisation au seuil d’un Fischer F (48; 544) : Le logiciel nous donne directement la pvalue associée à ce test. En l’occurrence ici, cette pvalue est très largement inférieure au seuil de 5%, donc pour ce seuil, on rejette l’hypothèse nulle H0 d’égalité des constantes ®i et des coe¢cients ¯ i et °i: Il convient alors de tester l’hypothèse H0 2 ; d’égalité des coe¢cients et ° i (co- ¯i e¢cients associés aux variables explicatives) entre les pays. Ce test est noté sous la forme F test of Ai ; B = Ai ; Bi dans le …chier résultat de TSP. Dans le cadre de notre échantillon, la réalisation de la statistique de Fischer associée au test H 2 , 0 notée F2 ; est de 1:1845. Cette valeur est à comparer au seuil d’un Fischer avec (N ¡ 1) K et N T ¡ N (K + 1) degrés de liberté , c’est à dire ici un F (32; 544) : La pvalue indique ici que jusqu’au seuil de 25%, l’hypothèse nulle ne peut pas être rejetée. A 5%, on con- …rme donc ici la structure de panel, puisque l’on est en droit de supposer qu’il existe des coe¢cients communs pour tous les pays entre le volume des grèves et les variables explicatives que sont le chômage et l’in‡ation. Reste en…n à tester l’hypothèse 0 3 de constantes individuelles ®i : Ce test est H noté sous la forme F test of Ai ; B = Ai ; B dans le …chier résultat de TSP. Dans le cadre de notre échantillon, la réalisation de la statistique de Fischer associée 0au test H 3 , notée F3 ; est de 9:0342. Cette valeur est à comparer au seuil d’un Fischer avec N ¡ 1 et N (T ¡ 1) ¡ K degrés de liberté , c’est à dire ici un F (16; 576) : La pvalue est très largement inférieure au seuil de 5%. Pour ce seuil, on rejette l’hypothèse nulle H0 d’égalité des constantes ®i : Il est nécessaire d’introduire ici des e¤ets individuels. La spéci…cation …nale de notre modèle est donc : si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17 (1.20) Reste à présent à étudier les di¤érentes méthodes d’estimation des modèles incluant
  • 25.
  • 26. L’Econométrie des Données de Panel 20 2. Modèles à e¤ets individuels Nous allons à présent nous à des modèles de panel hétérogènes, où la seule source d’hétérogénéité provient des constantes individuelles. On suppose ainsi que les coe¢- cients des di¤érentes variables stochastiques explicatives sont identiques pour tous les individus du panel (¯ i = ¯). On suppose en outre que ces coe¢cients sont des con- stantes déterministes. Les constantes individuelles ®i ; quant à elles, di¤èrent selon les individus. Hypothèse (H1) On suppose que les N vecteurs de paramètres ¯ i sont identiques, ¯ i = ¯ 2 R; 8 i 2 [1; N ] ; tandis que les constantes ®i peuvent di¤érer selon 2 les individus. En particulier, il existe au moins un couple (j; i) 2 [1; N ] tel que ®j = ®i Sous l’hypothèse (H 1), le modèle (1.1), s’écrit sous la forme suivante : yi;t = ®i + ¯ 0 xi;t + "i;t (2.1) où ®i 2 R et ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) 2 RK est un vecteur de constantes. Les innovations "i;t sont supposées être i:i:d: de moyenne nulle, de variance égale à ¾ 2 ; 8 i 2 [1; N ] et " sont supposées non corrélées que ce soit dans la dimension individuelle ou dans la dimension temporelle. Dès lors, dans ce contexte, on doit distinguer deux cas : le cas où les paramètres ®i sont des constantes déterministes (modèle à e¤ets …xes) et le cas où les paramètres ®i sont des réalisations d’un variable aléatoire d’espérance et de variance …nie (modèle à e¤ets aléatoires). Nous allons donc successivement envisager ces deux types de modèle (sections 3 et 4). Toutefois, avant de présenter ces deux modèles, nous commencerons tout d’abord par introduire les di¤érentes méthodes d’empilement de données de panel qui autorisent une écriture vectorielle du modèle à e¤et individuel. En e¤et, il existe deux possibilité d’écriture vectorielle du modèle (2.1). Autrement dit, il existe deux façons d’empiler les données : 1. Empilement par individus : pour une variable donnée, les T réalisations his- toriques de chaque individu sont stockées dans un vecteur colonne, et les N vecteurs colonnes ainsi obtenus sont ensuite empilés à la suite des uns des autres dans l’ordre des individus.
  • 27. L’Econométrie des Données de Panel 21 2. Empilement par dates : pour une variable donnée, les N réalisations individuelles pour une date donnée sont stockées dans un vecteur colonne, et les T vecteurs colonnes ainsi obtenus pour toutes les dates sont ensuite empilés à la suite des uns des autres. Il est très important de noter que les principaux logiciels d’économétrie (notamment TSP) optent généralement pour une méthode d’empilement par pays. Si le logiciel n’empile pas lui même les données, les séries utilisées dans le cadre des applications doivent, de façon impérative, être ordonnées sous la forme préconisée par les concepteurs du logiciel. 2.1. Empilement par pays Considérons tout d’abord la méthode d’empilement par pays. On considère un échan- tillon de N individus sur T périodes, et un modèle avec K variables explicatives. On pose : 0 1 0 0 1 yi;1 x1;i;1 x2;i;1 ::: "i;1 B C B C B yi;2 C 1 B "i;2 C i ::: xK;i;1 i = C ::: B B x1;i;2 x2;i;2 ::: xK;i;2 C Xi = " ::: ::: ::: ::: y =@ A (T ;K) @ A (T ;1) @ A (T ;1) yi;T x1;i;T x2;i;T ::: xK;i;T "i;T On dé…nit en outre un vecteur unitaire, noté e; tel que : 0 1 1 B 1 C e =B C (T ;1) @ ::: A 1 De…nition 2.1. Dans le cas de l’empilement par pays, pour chaque individu 8i 2 [1; N ] ; le modèle (2.1) peut s’écrire sous la forme : yi = e®i + Xi ¯ + "i 8 i = 1; ::; N (2.2) C’est principalement cette expression du modèle (2.1) que l’on utilisera par la suite pour étudier les estimateurs du modèle linéaire simple. On peut toutefois écrire le modèle de façon totalement vectorielle en empilant les vecteurs yi et les matrices Xi : Pour cela on pose : 01 0 1 0 1 y1 X1 "1 B y2 C B X C B" C Y =B C X =B 2 C " =B 2 C ::: ::: :::
  • 28. L’Econométrie des Données de Panel @ A @ A @ A 22 (T N;1) (T N;K ) (T N;1) yN XN "N
  • 29. On dé…nit 0T le vecteur nul de dimension (T ; 1) : 0 1 0 1 e ®1 B 0T C B ®2 C e = 0T ::: 0T ® = B e ::: 0T C B C e (T N ;N ) @ ::: e ::: ::: 0T A (N;1) @ ::: A 0T 0T ::: e ®N On obtient alors la représentation vectorielle suivante : e e® + X ¯ + " (2.3) 2.1.1. Exemple Considérons un panel de 2 pays (N = 2), dont les données annuelles sont disponibles sur 3 ans (T = 3). On cherche à estimer une fonction de production log-linéaire (Cobb- Douglass), supposée commune à ces deux pays. Soit yi;t le logarithme du P I B, ki;t le logarithme du stock de capital privé et ni;t le logarithme de l’emploi. On suppose que cette fonction de production s’écrit sous la forme : yi;t = ®i + ¯ k ki;t + ¯ n ni;t + "i;t 8 i 2 [1; 2] ; 8 t 2 [1; T ] où ¯ k et ¯ n désignent respectivement les élasticités (supposées communes aux deux pays) de la production par rapport au capital et à l’emploi. L’e¤et individuel ®i mesure ici les spéci…cités a-temporelles de la productivité totale des facteurs qui correspond dans cette régression, aux résidus "i;t : Ce modèle s’écrit sous forme vectorielle de la façon suivante : 0 1 0 1 0 1 0 1 yi;1 1 ki;1 ni;1 µ ¶ "i;1 ¯ @ yi;2 A = @ 1 A ®i + @ ki;2 ni;2 A k + @ "i;2 A ¯ n yi;3 1 ki;3 ni;3 "i;3 () yi = e®i + Xi ¯ + "i 8 i = 1; ::; N L’écriture vectorielle complète du modèle est la suivante : 0 1 0 1 0 0 1 y1;1 1 0 k1;1 n1;1 "1;1 C B 1 B y B 1;2 C B 1 0 C B k1;2 B n1;2 CCµ Cµ B k1;3 y1;3 1 0 ®1 + n1;3 C B C C B "1;2 C "1;3 + B C ¶ B C B C B C ¯k B C = B C B C B C B C y2;1 k2;1 n2;1 "2;1
  • 30. B C B 0 1 C ®2 B C ¯n B C B C B C B C ¶ B C y2;2 k2;2 n2;2 "2;2 @ A @0 1 A @ A @ A y2;3 0 1 k2;3 n2;3 "2;3 e e® + X ¯ + "
  • 31. 2.2. Empilement par dates De façon parallèle, il est possible de représenter de façon symétrique le modèle (2.1) en utilisant la méthode d’empilement par dates. Pour ce faire, il su¢t de poser les dé…nitions suivantes : 0 1 0 0 1 y1;t x1;1;t x2;1;t ::: "1;t B C 1 B C B y2;t C B "2;t C t xK;1;t t = ::: B C ::: Xt = B x1;2;t x2;2;t ::: xK;2;t C " ::: ::: ::: ::: y =@ A @ A @ A (N;1) (N;K) (T ;1) yN;t x1;N;t x2;N;t ::: xK;N;t "N;t De…nition 2.2. Dans le cas de l’empilement par dates, pour chaque date t 2 [1; T ] ; le modèle (2.1) peut s’écrire sous la forme : yt = e + Xt ¯ + "t ® 8 t = 1; ::; T (2.4) De la même façon, il est possible d’exprimer le modèle (2.1) sous une forme vecto- rielle complète. On pose : 0 1 0 1 0 1 y1 X1 "1 B y2 C B X2 C B " C Y =B C X =B C =B 2 C ::: ::: ::: @ A @ A @ A (T N;1) (T N;K ) " (T N;1) yT XT "T Soit IN la matrice identité de dimension (N; N ) : On dé…nit la matrice suivante : 0 1 IN B C e = B IN C e (T N ;N ) @ ::: A IN Il vient alors : e e® + X ¯ + " (2.5) 2.2.1. Exemple Reprenons l’exemple présenté précédemment. Lorsque les données sont empilées par dates, ce modèle s’écrit sous forme vectorielle de la façon suivante : µ ¶ µ ¶ µ ¶µ ¶ µ ¶ y1;t ®1 + k1;t n1;t ¯ k + "1;t = y2;t ®2 k2;t n2;t ¯n "2;t () yt = ® + Xt ¯ + "t e 8 t = 1; ::; T
  • 32. L’écriture vectorielle complète du modèle est la suivante : 0 1 0 1 0 1 y1;1 0 1 k1;1 n1;1 "1;1 1 0 B k2;1 B n2;1 C B y2;1 C B 0 1 C µ B B C B C ¶ B C ¶ B B B "2;1 C C k1;2 Cµ y1;2 B1 0 ®1 n1;2 ¯k "1;2 B C B C B B C= +B C y2;2 C B k ;2 C "2;2 C +B C C B C B C B 0 1 C ®2 B C B B 2 n2;2 C ¯n B C B C @ A B C A @ y1;3 A 1 0 @ k1;3 @ 0 1 n1;3 A "1;3 y2;3 k2;3 n2;3 "2;3 e e® + X ¯ + " Maintenant que nous avons présenté l’écriture vectorielle des modèles de panel à e¤ets individuels, nous allons à présent étudier les propriétés des estimateurs des paramètres de ces modèles suivant la spéci…cation des e¤ets individuels. Nous dis- tinguerons pour cela deux cas : le cas des e¤ets …xes et le cas des e¤ets aléatoires.
  • 33. 3. Modèle à e¤ets … xes On fait maintenant l’hypothèse que les e¤ets individuels ®i sont représentés par des constantes (d’où l’appellation modèle à e¤ets …xes ). Nous allons déterminer la forme générale des estimateurs des paramètres ®i et ¯ dans ce modèle à e¤ets … xes. On considère donc le modèle (1.1) sous l’hypothèse (H 1) : yi;t = ®i + ¯ 0 xi;t + "i;t 8 i 2 [1; N ] ; 8 t 2 [1; T ] (3.1) où ®i 2 R, ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) 2 RK . Tous les paramètres du modèle sont des constantes et l’on suppose pour simpli…er qu’il n’existe pas d’e¤et temporel. On dé… nit le vecteur "i tel que : ¢0 ¡ "i = "i;1 "i;2 ::: "i;T (T ;1) Pour étudier les propriétés des estimateurs du modèle à e¤ets …xes, nous allons faire une hypothèse supplémentaire sur la nature du processus des résidus "i;t : Cette hypothèse constitue tout simplement la généralisation dans la dimension de panel de la dé…nition d’un bruit blanc. Hypothèse (H2) On suppose que les résidus "i;t sont i:i:d: et satisfont les conditions suivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ] ² E ("i;t ) = 0 ½ ¾2" t=s ² E ("i;t "i;s ) = ; ce qui implique que E ("i "0 ) = ¾2 IT où It désigne i " 0 8t = s la matrice identité (T ; T ) : ² E ("i;t "j;s ) = 0; 8j = i; 8 (t; s) La première condition impose tout simplement que l’espérance des résidus du mod- èle (3.1) soit nulle. La seconde condition, standard en économétrie des séries tem- porelles, impose que le processus "i;t soit un processus ”sans mémoire” (dans la di- mension temporelle). Pour chaque individu, il n’existe ainsi aucune corrélation entre le niveau présent du processus "i;t et les réalisations passées. Seule la variance du processus "i;t est non nulle. L’introduction d’une dimension individuelle, nous oblige ici à dé…nir une seconde contrainte qui est que tous les processus individuels "i;t ont la même variance ¾2 quel que soit l’individu considéré. Autrement dit, la matrice " de variance covariance du processus "i est proportionnelle, à un scalaire près, à la matrice identité. En…n, la troisième condition stipule qu’il n’existe aucune corrélation entre les processus d’innovation pour deux individus distincts et cela quelle que soit la date considérée.
  • 34. 3.1. Estimateur Within ou LSDV Considérons l’écriture vectorielle du modèle obtenue par un empilement des données par pays. yi = e ®i + Xi ¯ + "i 8 i = 1; ::; N (3.2) (T ;1) (T ;1) (T ;K)(K;1) (T ;1) L’estimateur des Moindres Carrés Ordinaires (M C O) des paramètres ®i et ¯ dans le modèle à e¤ets …xes est appelé estimateur W ithin; ou estimateur à e¤ets …xes ou estimateur LSDV (Least Square Dummy Variable ). Comme nous l’avons vu, le terme W ithin s’explique par le fait cet estimateur tient compte de la variance intra groupe de la variable endogène. La troisième appellation LSDV tient au fait que cet estimateur conduit à introduire des variables dummies, qui dans la spéci…cation (3.2) correspondent aux vecteurs colonnes de e: On peut démontrer que sous l’hypothèse (H 2), l’estimateur des Moindres Carrés Ordinaires (MCO) des paramètres ®i et ¯ du modèle (3.2) est le meilleur estimateur linéaire sans biais (BLU E 7 ). Si l’on suppose que ¾ " est connu, cet estimateur est obtenu en minimisant la variance des résidus empiriques, notée S; par rapport aux seuls paramètres ®i et ¯: N N X X min 0 N S= "i0 "i = (yi ¡ e®i ¡ Xi ¯) (yi ¡ e®i ¡ Xi ¯) f®i ;¯gi=1 i=1 i=1 La première condition nécessaire de ce programme; nous donne immédiatement l’expression de l’estimateur de la constante ®i , 8 i 2 [1; N ] : 0 ® i = y i ¡ ¯b xi (3.3) b LSDV où les termes y i et xi désignent les moyennes individuelles des variables endogènes et exogènes. 1X 1X T T yi = yi;t xi = xi;t 8 i 2 [1; N ] (3.4) (1;1) T t=1 (K;1) T t=1 Ces moyennes sont donc calculées de façon traditionnelle dans la dimension tem- porelle, et cela pour chaque individu de l’échantillon. C’est pourquoi elles sont indicées en i: A partir de la seconde condition nécessaire du programme de minimisation, on montre que l’estimateur du paramètre vectoriel ¯ est donné par la relation suivante : "N T #¡1 " # N T X ¯bLSDV =
  • 35. X XX (xi;t ¡ xi ) (xi;t (xi;t ¡ xi ) (yi;t ¡ (3.5) 0 ¡ xi ) yi ) i=1 t=1 i=1 t=1 7 Best Linear Unbiased Estimator
  • 36. Proposition 3.1. L’estimateur W ithin ou LSDV de ¯; obtenu dans le modèle à e¤ets individuels …xes (3.2) est identique à l’estimateur des M C O obtenu à partir d’un modèle transformé où les variables expliquées et explicatives sont centrées sur leur moyennes individuelles respectives : 0 (yi;t ¡ y i ) = ¯b (xi;t ¡ xi ) + "i;t 8i 2 [1; N ] ; 8 t 2 [1; T ] (3.6) Les réalisations des estimateurs des constantes ®i sont alors déduits de la relation : b ®i = y i ¡ 0 ¯b xi En e¤et, on voit d’après l’équation (3.5), que l’estimateur W ithin des coe ¢cients de ¯ peut être obtenu en centrant les di¤érentes (variables endogène et exogènes) sur les moyennes individuelles respectives. Ainsi, on peut obtenir le même estimateur en utilisant le modèle transformé suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] : yi;t = ¯ 0 xi;t + "i;t e yi;t i;t xi;t i;t i ¡ y i ) et e avec e = (y = (x ¡ x ). En e¤et, dans ce cas on obtient : e " #¡1 " # N T N T XX XX ¯b = e ei;t e e i=1 t=1 0 i=1 t=1 xi;t yi;t xi;t x " #¡1 " # N T N T XX XX = (xi;t ¡ xi ) (xi;t ¡ (xi;t ¡ xi ) (yi;t ¡ y i ) 0 i=1 t=1 xi ) i=1 t=1 On reconnaît ici l’expression générale de l’estimateur W ithin ¯bLSDV : Reste alors à obtenir les réalisations des estimateurs des constantes individuelles selon la formule : 0 b 1 = y 1 ¡ ¯b ® x1 0 b 2 = y ¡ ¯b ® 2 x2 :::: b ®N = y N ¡ 0 ¯b x N
  • 37. Le fait qu’il soit équivalent d’estimer les paramètres du modèle (3.2) directement à partir de cette spéci…cation incluant des dummies individuelles ou à partir d’un modèle transformé où les variables sont centrées sur leurs moyennes individuelles respectives est particulièrement important. Cela illustre la notion de variance intra-classes qui est fondamentale dans la construction de l’estimateur Within. Nous allons à présent, proposer une illustration de cette propriété de l’estimateur W ithin:
  • 38. 3.2. Application Considérons à nouveau l’exemple du modèle de grèves dans le secteur industriel. Nous avons établi précédemment que le modèle de panel comportait des e¤ets individuels et pouvait s’écrire sous la forme: si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17 (3.7) où si;t désigne le nombre de jours chômés pour cause de grève, pour 1000 salariés du secteur industriel, ui;t désigne le taux de chômage de l’économie et pi;t le taux d’in‡ation. On suppose que l’on peut spéci…er les e¤ets individuels ®i sous la forme d’e¤ets …xes. Dans le programme ci-dessous, on cherche à comparer l’estimateur Within et l’estimateur des MCO du modèle transformé : (si;t ¡ si ) = ¯ (ui;t ¡ ui ) + ° (pi;t ¡ pi ) + "i;t (3.8) L’instruction panel de TSP avec les options notot, nobet et novar permet d’obtenir directement et uniquement les résultats de l’estimation W ithin: Pour construire les es- timateurs du modèle transformé, on doit au préalable centrer les variables sur leur moyennes individuelles respectives. Pour réaliser cette opération on construit une boucle sur les N = 17 individus, avec un compteur j et à chaque étape on sélectionne un pays dont le code pays (variable i) est égal à la valeur du compteur j (instruc- tion select i = j). Pour le sous échantillon sélectionné, l’instruction msd [Nom de la Variable ] permet alors de calculer di¤érents moments de la variable considérée sans les a¢cher (si l’on ajoute l’option noprint). En particulier, la moyenne empirique est stockée dans la variable réservée @mean. Dès lors, pour chaque individu, on construit de nouvelles variables en centrant sur les moyennes individuelles correspondantes. En- …n, il ne reste plus qu’à e¤ectuer la régression par les MCO sur le modèle transformé (instruction ls ou ols) load(file=’’strikes.wks’’); ?---- Estimation Within ---- panel (id=i,time=t,notot,nobet,novar) srt u p; ?---- Centrer les Données --- do j=1 to 17; select (i=j); msd(noprint) srt; srtc=srt-@mean; msd(noprint) u; uc=u-@mean; msd(noprint) p;
  • 39. pc=p-@mean; enddo; ?---- Estimation Modèle Transformé---- ls srtc uc pc; ?---- Affichage des Effets Fixes (Instruction Panel) ---- print @fixed; Les résultats de ce programme sont reproduits sur la …gure (3.1). On véri…e que l’estimateur W ithin est totalement équivalent à l’estimateur des M CO appliqué sur un modèle transformé où les variables endogènes et exogènes ont été centrées sur leurs moyennes individuelles respectives. Dans les deux cas, les réalisations des estimateurs des coe¢cients des deux variables explicatives (respectivement ui;t et pi;t ) sont stricte- ment identiques (respectivement ¡21:5968 et 16:2729). Dans le cas où l’on utilise la commande panel de TSP, on peut a¢cher les esti- mations des e¤ets …xes en utilisant la commande print @fixed. Dans le cas où l’on utilise le modèle transformé, il convient alors de reconstruire les estimateurs des ef- fets …xes selon la formule (3.3) en utilisant les moyennes individuelles des variables (cf. programme ci-dessus) et les réalisations des estimateurs des coe¢cients ° et ¯. Essayons à présent de commenter les estimations ainsi obtenues. Il s’avère ainsi que le pays 9 a, de façon structurelle, le plus de journées chômées pour cause de grève. Pour ce pays, di¤érents facteurs historiques (législation sur le droit de grève) ou soci- ologique (représentation des syndicats par exemple) expliquent que toutes choses égales par ailleurs (chômage et in‡ation), la fréquence des grève soit particulièrement élévée. A l’inverse, les pays 15 et 2 ont des e¤ets …xes négatifs. Pour un même niveau de chô- mage et d’in‡ation, ces deux pays auront le nombre de jours chômés le plus faible de tout notre échantillon. Il faut bien comprendre que les estimations des e¤ets individu- els ne peuvent s’analyser qu’en niveau relatif (c’est à dire en comparant les di¤érentes réalisations individuelles) et non en niveau absolu.
  • 40. L’Econométrie des Données de Panel 30 Figure 3.1: Comparaison des Estimateurs Whithin et OLS sur Modèle Transformé
  • 41. L’Econométrie des Données de Panel 31 3.3. Ecriture vectorielle Une façon équivalente d’obtenir l’estimateur W ithin et de montrer l’équivalence avec le modèle transformé où les variables sont centrées, consiste à travailler directement avec l’écriture vectorielle (3.2). Par la suite, nous adopterons souvent cette notation vecto- rielle qui permet d’alléger particulièrement les notations du modèle et des estimateurs correspondants. On considère donc le modèle vectoriel suivant : yi = e®i + Xi ¯ + "i 8 i = 1; ::; N (3.9) Nous allons à présent introduire un opérateur matriciel qui permet de centrer les variables sur leurs moyennes individuelles respectives. De…nition 3.2. Le modèle (3.9) à e¤et individuels …xes peut s’écrire sous la forme vectorielle suivante 8 i = 1; ::; N : Qyi = QXi ¯ + Q"i où la matrice Q de dimension (T ; T ) est telle que : 1 Q = IT ¡ ee0 (3.10) T L’estimateur W ithin du vecteur ¯ est alors dé…ni de la façon suivante : " #¡1 " # X N N X ¯b LSDV = Xi0 QXi Xi0 Qyi (3.11) i=1 i=1 En e¤et, on peut montrer que les processus transformés Qyi et QXi correspondent aux variables centrées sur leurs moyennes respectives. En e¤et, on montre que : 0 1 0 1 µ ¶ µ ¶ yi;1 Ã ! 1 T 1 1 = yi;2 1X 1 B C B C Qyi = IT 0 ¡ yi = yi ¡ e0 yi ¡ yi;t ee T e T ::: T ::: B C B @ A yi;T @ CA t=1 1 De la même façon, on peut montrer que : 1 QXi = Xi ¡ ee0 T Xi
  • 42. L’Econométrie des Données de Panel 32 0 1 0 1 x1;i;1 x2;i;1 ::: xK;i;1 1 ³ ´ B x1;i;2 x2;i;2 ::: xK;i;2 C 1 B 1 C PT PT PT QXi = B C¡ B C ::: ::: ::: ::: t=1 x1;i;t t=1 x2;i;t ::: t=1 xK;i;t @ A T @ ::: A x1;i;T x2;i;T ::: xK;i;T 1
  • 43. Dès lors, a…n d’éliminer les e¤ets individuels de l’équation (3.9), il su¢t de prémul- tiplier les membres de cette équation par Q. Ainsi 8 i = 1; ::; N Qyi = Qe®i + QXi ¯ + Q"i () Qyi = QXi ¯ + Q"i En appliquant les M C O à cette expression on obtient donc une écriture équivalente de ¯bLSDV : " #¡1 " N # X N X ¯b LSDV = 0 Xi QXi 0 Xi Qyi (3.12) i=1 i=1
  • 44. 4. Modèle à e¤ets aléatoires Dans la pratique standard de l’analyse économétrique, on suppose qu’il existe un grand nombre de facteurs qui peuvent a¤ecter la valeur de la variable expliquée et qui pour- tant ne sont pas introduits explicitement sous la forme de variables explicatives. Ces facteurs sont alors approximés par la structure des résidus. Le problème se pose de la façon similaire en économétrie de panel. La seule di¤érence tient au fait que trois types de facteurs omis peuvent être envisagés. Il y a tout d’abord les facteurs qui af- fectent la variable endogène di¤éremment suivant la période et l’individu considéré. Il peut en outre exister des facteurs qui a¤ectent de façon identique l’ensemble des indi- vidus, mais dont l’in‡uence dépend de la période considérée (e¤ets temporel). En…n, d’autres facteurs peuvent au contraire re‡éter des di¤érences entre les individus de type structurelles, c’est à dire indépendantes du temps (e¤ets individuel). Dès lors le résidu, noté "i;t ; d’un modèle de panel peut être décomposé en trois principales composantes de la façon suivante (Hsiao 1986) 8 i 2 [1; N ] ; 8 t 2 [1; T ] : "i;t = ®i + ¸t + vi;t (4.1) Les variables ®i désignent ici les e¤ets individuels qui représentent l’ensemble des spéci…cités structurelles ou a-temporelles de la variable endogène, qui di¤érent selon les individus. On suppose ici que ces e¤ets sont aléatoires. Les variables aléatoires ¸t représentent quant à elle les e¤ets temporels strictement identiques pour tous les individus. En…n, le processus stochastique vi;t désigne la composante du résidu total "i;t orthogonale aux e¤ets individuels et aux e¤ets temporels. Généralement, on est conduit à faire un certain nombre d’hypothèses techniques sur cette structure de résidus. Hypothèses (H3) On suppose que les résidus "i;t = ®i +¸t +vi;t sont i:i:d: et satisfont les conditions suivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ] ² E (®i ) = E (¸t ) = E (vi;t ) = 0 ² E (®i ¸t ) = ½ (¸t vi;t ) = E (®i vi;t ) = 0 E ¾2® i=j ² E (®i ®j ) = 0 8i = j ½ 2 ¾¸ t=s ² E (¸t ¸s ) 0 8t = s = ½ 2 ¾ t = s; i = j ² E (vi;t vj;s ) = v 0 8t = s; 8i = j ³ ´ ³ ´ ³ ² E ®i xi;t = E ¸t x 0 =E 0 i;t vi;t
  • 45. ´ 0 =0 i;t x
  • 46. Sous ces hypothèses, la variance de la variable endogène yi;t conditionnellement aux variables explicatives xi;t est alors égale à ¾2 = ¾2 + ¾2 + ¾2 . Les variances ¾2 , ¾2 et y ® ¸ v ® ¸ ¾ 2 correspondent aux di¤érentes composantes de la variance totale. C’est pourquoi, le v modèle à e¤ets aléatoires est aussi appelé modèle à erreurs composés (error component model ). Dans une première étape, nous allons présenter le modèle simple à e¤ets individuels aléatoires. Nous supposerons ainsi, pour simpli…er l’analyse, qu’il n’existe pas d’e¤et temporel. Nous proposerons alors une écriture vectorielle du modèle à e¤ets aléatoires. Dans une seconde étape nous étudierons les estimateurs des di¤érents coe ¢cients de ce modèle. 4.1. Modèle à variance composée On se limite au cas où il n’existe pas d’e¤et temporel (¸t = 0; 8t). On considère donc le modèle suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] : yi;t = ¹ + ¯ 0 xi;t + "i;t (4.2) "i;t = ®i + vi;t (4.3) où ¯ 0 = (¯ 1 ¯ 2 ::::¯ K ) est un vecteur de constantes et le processus f"i;t g satisfait les hypothèses (H3 ). La constante ¹ désigne ici l’espérance inconditionnelle du processus y;i;t puisque on suppose que E (®i ) = 0; 8 i 2 [1; N ] : Proposition 4.1. Le modèle à e¤ets individuels aléatoires s’écrit vectoriellement sous la forme : yi = X ° + "i 8 i = 1; ::; N (4.4) ei (T ;1) (T ;K +1) (T ;1) (K+1;1) ¡ ¢ avec "i = ®i e + X ei = (e; Xi ) et ° 0 = ¹; ¯ 0 : Sous les hypothèses (H3 ), la vi ; matrice de variance covariance de "i ; notée V; est alors dé…nie par : ¡ 0¢ £ 0 ¤ V = E "i "i = E (®i e + vi ) (®i e + vi ) = ® 2 ee0 +v ¾2 IT ¾ (4.5) L’inverse de cette matrice de variance covariance est dé…nie comme : 1 · µ ¶ ¸ V ¡1 = ¾2 ® 0 IT ¡ ee (4.6) ¾2 ¾2 2 v v + T ¾® Donnons ici une démonstration possible de ce résultat8 . On pose e V Ve dé…nition on a Ve V = V Ve = IT : On en déduit que : V Ve = ¾2 ee0 Ve + ¾2 V = IT () ¾ 2 V = IT ¡ ¾2 ee0
  • 47. = V ¡1 : Par e e ® v v ® 8 Pour une démonstration plus élégante voir Graybill (1969), Nerlove (1971), Wallace et Hussain (1969)
  • 48. Reste alors à déterminer l’expression de ee0 Ve : Raisonnons par une méthode de 0 e coe¢cient indéterminé. On suppose que ee V peut s’écrire sous la forme µee0 où µ 2 R+ . Considérons l’expression de ee0 Ve V en substituant ee0 Ve par son expression, il vient : ee0 Ve V = µee0 V ¡ ¢ = µee0 ¾ 2® e0 + ¾v IT 2 £ ¡e ¢ ¤ ¡ ¢ 2 0 0 2 0 = µ¾® e e e e + µ¾ ee v Par dé…nition de Ve ; on a ee0 Ve V = ee0 : Sachant que e (e0 e) e0 = T ee0 ; on obtient alors la relation suivante : ee0 Ve V = ee0 ¡ ¢ () µee0 ¾ 2 T + ¾2 = ®ee0 v On en déduit immédiatement la valeur du paramètre µ : 1 µ= 2 R+ ®T + ¾v On obtient ainsi : ¾2 2 µ ¶ 1 ee Ve = 0 ee 0 ¾2 2 ®T + ¾v Dès lors, en reprenant l’expression de Ve , il vient : µ ¶ 2 2 e = I ¾® ¾v V T ¡ 2 2 e e0 ¾ T ® + ¾v Ainsi, l’inverse de la matrice de variance covariance des "i s’écrit sous la forme : · µ ¶ ¸ ¡1 1 ¾2 ® 0 V = IT ¡ ee ¾2 2 ¾2 v v + T ¾® L’écriture vectorielle du modèle à e¤ets aléatoires de la proposition (4.1) nous sera particulièrement dans la section suivante pour construire les estimateurs des di¤érents paramètres de ce modèle. 4.2. Estimateurs du modèle à e¤ets aléatoires Nous allons à présent nous intéresser aux propriétés des estimateurs du modèle aléa-
  • 49. toire. Pour bien comprendre ces propriétés, il est nécessaire de bien appréhender les conséquences de la structure des résidus.
  • 50. Remark 1. Dans le modèle de la proposition (4.1), le fait que les e¤ets individuels ®i constituent l’une des composantes des résidus "i du modèle (4.4), induit une cor- rélation entre le niveau de ces résidus lorsque l’on considère un individu donné. En revanche, sous (H3 ), il n’existe pas de corrélation de ces résidus dans la dimension inter individuelle. Quelles sont alors les conséquences de cette structure des résidus ? Si l’on raisonne en termes de biais d’estimation, il n’y en a aucune dès lors que l’on centre les variables du modèle sur leur moyenne respective. En e¤et, dans ce cas la composante individuelle des résidus disparaît et les corrélations inter-individuels des résidus du modèle transformé disparaissent par la même occasion. Pour le vecteur ¯; on retrouve alors la forme générale de l’estimateur du modèle à e¤ets …xes. Pour preuve, appliquons l’opérateur Q au modèle à e¤et aléatoire : Qyi = Qe¹ + QXi ¯ + Qe®i + Qvi ¡ ¢ ¡1 Or, on sait par dé…nition de l’application que Qe = IT ¡ T ee0 e = 0: Dès lors, on obtient le modèle 8 i 2 [1; N ] : Qyi = Qe¹ + QXi ¯ + Qvi (4.7) Dans ce modèle, sous (H3 ), l’estimateur ¯bLSDV du vecteur ¯ est non biaisé et convergent 9 . L’estimateur de la constante ¹ est alors construit sous la forme : 0 ¹ = y ¡ ¯b x (4.8) b LSDV avec : N T N T 1 XX 1 XX yi = yi;t x = xi;t (4.9) (1;1) NT (K;1) NT i=1 t=1 i=1 t=1 Ainsi, il n’existe pas de problème de biais lorsque l’on envisage les techniques d’es- timation utilisées dans les modèles à e¤ets …xes, c’est à dire lorsque l’on centre les variables sur leurs moyennes individuelles respectives. Toutefois, l’estimateur ¯bLSDV ainsi obtenu n’est pas un estimateur à variance minimale : c’est pas l’estimateur BLU E: Proposition 4.2. Dans un modèle à e¤ets aléatoires, l’estimateur Within ¯bLSDV ; obtenu sous l’hypothèse d’e¤ets …xes, est un estimateur sans biais et convergent du vecteur de paramètres ¯: Toutefois, ce n’est pas l’estimateur BLU E. Un estimateur BLU E est alors donné par l’estimateur de Moindres Carrés Généralisés
  • 51. (MCG). 9 On a en e¤et : p ¯b LS DV ¡! ¯ N T !1 où l’indice p désigne la convergence en probabilité (voir section précédente pour une démonstration).
  • 52. Nous ne donnerons pas ici de démonstration de cette propriété. Si l’on résume, quelle que soit la nature des e¤ets individuels (…xes ou aléatoires), l’estimateur Within est un estimateur sans biais et convergent. Toutefois, cette estimateur n’est pas un estimateur à variance minimale lorsque les e¤ets individuels sont aléatoires. Un estimateur BLU E possible du vecteur ¯ est alors donné par l’estimateur de Moindres Carrés Généralisés (MCG). Cette propriété sera particulièrement intéressante lorsqu’il sera nécessaire de discriminer les deux modèles et de construire les tests de spéci…cation appropriés (test d’Hausman 1978, en particulier). 4.3. Estimateur des Moindres Carrés Généralisés Nous avons vu que dans un modèle à e¤ets aléatoires, un estimateur BLU E peut être construit à partir de l’estimateur des Moindres Carrés Généralisés (MCG). Considérons le modèle vectoriel de la proposition (4.1) : yi = Xei ° + "i 8 i = 1; ::; N (4.10) avec "i = ®i e +vi ¡ ¢ ; Xei = (e; Xi ) et ° 0 = ¹; ¯ 0 : Soit V la matrice de variance covariance du vecteur des résidus "i : V = E ("i "i0 ) : On suppose, dans un premier temps, que V est connue. Le problème est que, du fait de la structure du modèle, la matrice V n’est pas diagonale en raison de la présence de corrélations intra-individuelles des résidus. Tout comme en séries temporelles, c’est pourquoi on applique alors les MCG. De…nition 4.3. Si la matrice V est connue, l’estimateur des MCG du vecteur °; noté °M b G C; est alors dé…ni par la relation : " #¡1 " # N N X X °M C G = b Xe 0 V 1 e i ¡ Xi 0 V ¡ e 1 (4.11) i=1 Xi i=1 yi °M C G Cette dé…nition de l’estimateur b correspond à la dé…nition générale (iden- tique à celle utilisée en série temporelle, cf. Bourbonnais 2000) des Moindres Carrés Généralisés. Bien entendu, lorsque la matrice V n’est pas connue, b l’estimateur ° M C G est obtenu en deux étapes. La première étape consiste à appliquer l’estimateur W ithin pour obtenir une première estimation sans biais et convergente des paramètres ¯ et ¹: A partir de ces estimations, on construit les séries de résidus individuels "i et l’on construit un estimateur Vb
  • 53. de la matrice de variance covariance V: La seconde étape consiste alors à appliquer l’estimateur des MCG selon la formule (4.11) en utilisant l’estimateur de V: Vb Il existe une autre façon d’obtenir l’estimateur des MCG. En e¤et, dans la pratique, la procédure en deux étapes, utilisée dans les principaux logiciels d’économétrie, n’est