SlideShare ist ein Scribd-Unternehmen logo
1 von 41
Downloaden Sie, um offline zu lesen
Les sondages aléatoires simples
Mahamadou HARO
Ingénieur Statisticien Économiste
Séminaire de sondage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 1 / 21
Plan de la présentation
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 2 / 21
Principe
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 3 / 21
Principe
Introduction
De l’univers on extrait un échantillon de taille n, en accordant à chaque
unité statistique la même probabilité d’être tirée. L’échantillon peut être
tiré :
avec remise : une unité ayant été sélectionnée à un des tirages
est "remise dans l’urne de tirage" et participe aux tirages
suivants ; elle peut donc être tirée deux fois, ou plus ;
sans remise : une fois une unité tirée, elle n’est plus prise en
compte pour les tirages suivants (c’est le mode de tirage qui
semble le plus "naturel").
Le sondage aléatoire simple est la base de la méthode des sondages,
à partir de laquelle sont développées les autres méthodes présentées
dans ce manuel.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
Principe
Introduction
De l’univers on extrait un échantillon de taille n, en accordant à chaque
unité statistique la même probabilité d’être tirée. L’échantillon peut être
tiré :
avec remise : une unité ayant été sélectionnée à un des tirages
est "remise dans l’urne de tirage" et participe aux tirages
suivants ; elle peut donc être tirée deux fois, ou plus ;
sans remise : une fois une unité tirée, elle n’est plus prise en
compte pour les tirages suivants (c’est le mode de tirage qui
semble le plus "naturel").
Le sondage aléatoire simple est la base de la méthode des sondages,
à partir de laquelle sont développées les autres méthodes présentées
dans ce manuel.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
Estimation d’une moyenne
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 5 / 21
Estimation d’une moyenne
Estimation d’une moyenne
Pour estimer la moyenne Y d’une variable Y sur l’univers (Y est bien
sûr inconnue) il semble naturel d’utiliser l’estimateur :
¯y =
1
n
n
i=1
yi (1)
moyenne calculée sur les unités de l’échantillon. y est un estimateur
sans biais la moyenne de l’universY. Cette propriété peut s’écrire :
E(¯y) = ¯Y
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 6 / 21
Estimation d’une moyenne
Variance de y
Dans le cas avec remise :
V(¯y) =
V(Y)
n
(2)
Dans le cas sans remise :
V(¯y) = (
N − n
N − 1
)
V(Y)
n
(3)
Ceci veut dire que la variance de l’estimateur sera d’autant plus
faible que :
a)V(Y) sera faible ;
b)la taille de l’échantillon sera importante.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
Estimation d’une moyenne
Variance de y
Dans le cas avec remise :
V(¯y) =
V(Y)
n
(2)
Dans le cas sans remise :
V(¯y) = (
N − n
N − 1
)
V(Y)
n
(3)
Ceci veut dire que la variance de l’estimateur sera d’autant plus
faible que :
a)V(Y) sera faible ;
b)la taille de l’échantillon sera importante.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
Estimation d’une moyenne
Pour un échantillon suffisamment grand, y suit une loi
normale
À partir d’une certaine taille d’échantillon (disons au moins 30), la
distribution de la variable aléatoire y (c’est-à-dire l’ensemble des
estimations fournies par tous les échantillons obtenus avec le
tirage équiprobable de taille n) s’ajuste sur une loi normale
(courbe "en cloche" de Gauss) dont les caractéristiques sont liées
aux valeurs E(y) et V(y) étudiées ci-dessus.
On sait que la distribution d’une loi normale de moyenne m et
d’écart-type σ comprend 95% des valeurs dans l’intervalle
[m − 1, 96σ; m + 1, 96σ].
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
Estimation d’une moyenne
Pour un échantillon suffisamment grand, y suit une loi
normale
À partir d’une certaine taille d’échantillon (disons au moins 30), la
distribution de la variable aléatoire y (c’est-à-dire l’ensemble des
estimations fournies par tous les échantillons obtenus avec le
tirage équiprobable de taille n) s’ajuste sur une loi normale
(courbe "en cloche" de Gauss) dont les caractéristiques sont liées
aux valeurs E(y) et V(y) étudiées ci-dessus.
On sait que la distribution d’une loi normale de moyenne m et
d’écart-type σ comprend 95% des valeurs dans l’intervalle
[m − 1, 96σ; m + 1, 96σ].
Ici on peut dire que 95% des valeurs de y sont situées dans
l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est
donnée par les formules (2) ou (3) ci-dessus.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
Estimation d’une moyenne
Pour un échantillon suffisamment grand, y suit une loi
normale
À partir d’une certaine taille d’échantillon (disons au moins 30), la
distribution de la variable aléatoire y (c’est-à-dire l’ensemble des
estimations fournies par tous les échantillons obtenus avec le
tirage équiprobable de taille n) s’ajuste sur une loi normale
(courbe "en cloche" de Gauss) dont les caractéristiques sont liées
aux valeurs E(y) et V(y) étudiées ci-dessus.
On sait que la distribution d’une loi normale de moyenne m et
d’écart-type σ comprend 95% des valeurs dans l’intervalle
[m − 1, 96σ; m + 1, 96σ].
Ici on peut dire que 95% des valeurs de y sont situées dans
l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est
donnée par les formules (2) ou (3) ci-dessus.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
Estimation d’une moyenne
La variance V(y) peut être estimée à partir de
l’échantillon
Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est
inconnue. Celle-ci va être estimée à partir des données
observées sur l’échantillon. Si l’on note s2 la grandeur calculée
sur l’échantillon :
s2
=
1
n − 1
n
i=1
(yi − ¯y)2
Alors on a le résultat suivant :
dans le cas sans remise, s2 est un estimateur sans biais de
N
N−1 V(Y)
Donc V(y) est estimée sans biais par :
ˆV(y) = s2
n dans le cas de tirage avec remise ;
ˆV(y) = (1 − n
N )s2
n dans le cas du tirage sans remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
Estimation d’une moyenne
La variance V(y) peut être estimée à partir de
l’échantillon
Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est
inconnue. Celle-ci va être estimée à partir des données
observées sur l’échantillon. Si l’on note s2 la grandeur calculée
sur l’échantillon :
s2
=
1
n − 1
n
i=1
(yi − ¯y)2
Alors on a le résultat suivant :
dans le cas sans remise, s2 est un estimateur sans biais de
N
N−1 V(Y)
dans le cas avec remise, s2 est un estimateur sans biais de V(Y).
Donc V(y) est estimée sans biais par :
ˆV(y) = s2
n dans le cas de tirage avec remise ;
ˆV(y) = (1 − n
N )s2
n dans le cas du tirage sans remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
Estimation d’une moyenne
La variance V(y) peut être estimée à partir de
l’échantillon
Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est
inconnue. Celle-ci va être estimée à partir des données
observées sur l’échantillon. Si l’on note s2 la grandeur calculée
sur l’échantillon :
s2
=
1
n − 1
n
i=1
(yi − ¯y)2
Alors on a le résultat suivant :
dans le cas sans remise, s2 est un estimateur sans biais de
N
N−1 V(Y)
dans le cas avec remise, s2 est un estimateur sans biais de V(Y).
Donc V(y) est estimée sans biais par :
ˆV(y) = s2
n dans le cas de tirage avec remise ;
ˆV(y) = (1 − n
N )s2
n dans le cas du tirage sans remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
Estimation d’une moyenne
Dans la pratique on n’a tiré qu’un échantillon
Ce qui vient d’être dit aux paragraphes précédents doit être
replacé dans cette perspective. Les résultats ci-dessus présentent
la manière dont l’ensemble des valeurs calculées sur tous les
échantillons possibles se répartissent par rapport à la grandeur
recherchée Y.
En pratique, le seul résultat dont on dispose est la moyenne y
calculée sur un échantillon, et Y est inconnue.
On tient un raisonnement analogue au précédent, mais à partir de
y, pour fournir un "intervalle de confiance" pour Y.
on dispose de la valeur y ;
on estime V(y) à partir de l’échantillon, on obtient donc une
estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ;
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
Estimation d’une moyenne
Dans la pratique on n’a tiré qu’un échantillon
Ce qui vient d’être dit aux paragraphes précédents doit être
replacé dans cette perspective. Les résultats ci-dessus présentent
la manière dont l’ensemble des valeurs calculées sur tous les
échantillons possibles se répartissent par rapport à la grandeur
recherchée Y.
En pratique, le seul résultat dont on dispose est la moyenne y
calculée sur un échantillon, et Y est inconnue.
On tient un raisonnement analogue au précédent, mais à partir de
y, pour fournir un "intervalle de confiance" pour Y.
on dispose de la valeur y ;
on estime V(y) à partir de l’échantillon, on obtient donc une
estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ;
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
Estimation d’une moyenne
Remarques
La précision, en termes de variance de y est essentiellement liée
au nombre d’unités enquêtées n, et relativement peu au taux de
sondage n
N (pas du tout dans le cas avec remise).
La variance est proportionnelle à 1
n ; l’écart-type, qui permet
d’établir l’intervalle de confiance, est proportionnel à 1√
n
.Ceci veut
dire que pour réduire de moitié l’intervalle de confiance, il faut
quatre fois plus de questionnaires.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
Estimation d’une moyenne
Remarques
La précision, en termes de variance de y est essentiellement liée
au nombre d’unités enquêtées n, et relativement peu au taux de
sondage n
N (pas du tout dans le cas avec remise).
La variance est proportionnelle à 1
n ; l’écart-type, qui permet
d’établir l’intervalle de confiance, est proportionnel à 1√
n
.Ceci veut
dire que pour réduire de moitié l’intervalle de confiance, il faut
quatre fois plus de questionnaires.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
Estimation d’une moyenne
Combien d’unités enquêter dans l’échantillon ?
On voit que la réponse à cette question se trouve dans les
formules (2) et (3) : si l’on fixe un niveau de précision (largeur de
l’intervalle de confiance, ou coefficient de variation, ce qui signifie
une valeur "maxi"" de la variance), on en déduit le nombre
d’unités minimum nécessaire.
Le problème est que la quantité V(Y) est inconnue avant
l’enquête, dans les formules (2) et (3) ; la seule solution est de
l’estimer, soit de manière intuitive, soit à partir de données
observées sur le passé
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
Estimation d’une moyenne
Combien d’unités enquêter dans l’échantillon ?
On voit que la réponse à cette question se trouve dans les
formules (2) et (3) : si l’on fixe un niveau de précision (largeur de
l’intervalle de confiance, ou coefficient de variation, ce qui signifie
une valeur "maxi"" de la variance), on en déduit le nombre
d’unités minimum nécessaire.
Le problème est que la quantité V(Y) est inconnue avant
l’enquête, dans les formules (2) et (3) ; la seule solution est de
l’estimer, soit de manière intuitive, soit à partir de données
observées sur le passé
ici on se place dans une phase de réflexion en amont de la
réalisation sur le terrain).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
Estimation d’une moyenne
Combien d’unités enquêter dans l’échantillon ?
On voit que la réponse à cette question se trouve dans les
formules (2) et (3) : si l’on fixe un niveau de précision (largeur de
l’intervalle de confiance, ou coefficient de variation, ce qui signifie
une valeur "maxi"" de la variance), on en déduit le nombre
d’unités minimum nécessaire.
Le problème est que la quantité V(Y) est inconnue avant
l’enquête, dans les formules (2) et (3) ; la seule solution est de
l’estimer, soit de manière intuitive, soit à partir de données
observées sur le passé
ici on se place dans une phase de réflexion en amont de la
réalisation sur le terrain).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
Estimation d’un total
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 13 / 21
Estimation d’un total
Estimation d’un total
Les estimations de totaux sont en général des estimations
d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total
d’une variable Y est estimé, à partir de l’échantillon, par l’
estimateur de sa moyenne multiplié par l’effectif de l’univers :
ˆT(Y) = Ny (4)
En remplaçant y par son expression, on peut faire apparaître le
coefficient d’extrapolation ou la pondération N
n de chaque unité de
l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
Estimation d’un total
Estimation d’un total
Les estimations de totaux sont en général des estimations
d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total
d’une variable Y est estimé, à partir de l’échantillon, par l’
estimateur de sa moyenne multiplié par l’effectif de l’univers :
ˆT(Y) = Ny (4)
En remplaçant y par son expression, on peut faire apparaître le
coefficient d’extrapolation ou la pondération N
n de chaque unité de
l’échantillon.
La variance de l’estimateur du total se déduit aisément de celle y
en appliquant les propriétés de la variance.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
Estimation d’un total
Estimation d’un total
Les estimations de totaux sont en général des estimations
d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total
d’une variable Y est estimé, à partir de l’échantillon, par l’
estimateur de sa moyenne multiplié par l’effectif de l’univers :
ˆT(Y) = Ny (4)
En remplaçant y par son expression, on peut faire apparaître le
coefficient d’extrapolation ou la pondération N
n de chaque unité de
l’échantillon.
La variance de l’estimateur du total se déduit aisément de celle y
en appliquant les propriétés de la variance.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
Estimation d’une proportion
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 15 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Une des caractéristiques d’une telle variable est que sa variance
s’écrit de manière simple :V(Y) = P(1 − P)
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Une des caractéristiques d’une telle variable est que sa variance
s’écrit de manière simple :V(Y) = P(1 − P)
Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais
sa véritable valeur est inconnue et c’est l’enquête par sondage qui
cherche à l’estimer de manière précise), on pourra anticiper la
précision en fonction du nombre de questionnaires puisqu’on aura
apriori un ordre de grandeur de la variance de Y.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Une des caractéristiques d’une telle variable est que sa variance
s’écrit de manière simple :V(Y) = P(1 − P)
Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais
sa véritable valeur est inconnue et c’est l’enquête par sondage qui
cherche à l’estimer de manière précise), on pourra anticiper la
précision en fonction du nombre de questionnaires puisqu’on aura
apriori un ordre de grandeur de la variance de Y.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’un ratio
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 17 / 21
Estimation d’un ratio
Estimation d’un ratio
L’estimation d’un ratio peut être délicate, et révéler des pièges.
Prenons un exemple : supposons que l’univers soit un univers de
ménages (la base de sondage est une liste de ménages), et que
certaines caractéristiques comme le nombre d’enfants de moins de
cinq ans ne soient pas connues.
Comment estimer le poids corporel moyen des enfants de moins de
cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire
simple ? Remarquons que l’unité statistique utilisée pour le sondage
est le ménage et non l’individu. On procède ainsi :
on estime le nombre total d’enfants de moins de cinq ans ;
on estime ensuite le poids corporel total des enfants de moins de
cinq ans
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
Estimation d’un ratio
Estimation d’un ratio
L’estimation d’un ratio peut être délicate, et révéler des pièges.
Prenons un exemple : supposons que l’univers soit un univers de
ménages (la base de sondage est une liste de ménages), et que
certaines caractéristiques comme le nombre d’enfants de moins de
cinq ans ne soient pas connues.
Comment estimer le poids corporel moyen des enfants de moins de
cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire
simple ? Remarquons que l’unité statistique utilisée pour le sondage
est le ménage et non l’individu. On procède ainsi :
on estime le nombre total d’enfants de moins de cinq ans ;
on estime ensuite le poids corporel total des enfants de moins de
cinq ans
le ratio (ou quotient) de ces deux masses est l’estimation du poids
moyen de l’univers ; des enfants de moins de cinq ans.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
Estimation d’un ratio
Estimation d’un ratio
L’estimation d’un ratio peut être délicate, et révéler des pièges.
Prenons un exemple : supposons que l’univers soit un univers de
ménages (la base de sondage est une liste de ménages), et que
certaines caractéristiques comme le nombre d’enfants de moins de
cinq ans ne soient pas connues.
Comment estimer le poids corporel moyen des enfants de moins de
cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire
simple ? Remarquons que l’unité statistique utilisée pour le sondage
est le ménage et non l’individu. On procède ainsi :
on estime le nombre total d’enfants de moins de cinq ans ;
on estime ensuite le poids corporel total des enfants de moins de
cinq ans
le ratio (ou quotient) de ces deux masses est l’estimation du poids
moyen de l’univers ; des enfants de moins de cinq ans.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
Méthodes de tirage
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 19 / 21
Méthodes de tirage
Méthode simple
L’idée est de numéroter les unités statistiques, et de procéder à un
tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut
utiliser :
une table de nombre au hasard,qu’on parcourt dans le sens bien
défini au départ, par exemple ligne par ligne ;
Un algorithme informatique de tirage, par exemple par génération
au hasard d’un nombre réel entre 1 et N
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
Méthodes de tirage
Méthode simple
L’idée est de numéroter les unités statistiques, et de procéder à un
tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut
utiliser :
une table de nombre au hasard,qu’on parcourt dans le sens bien
défini au départ, par exemple ligne par ligne ;
Un algorithme informatique de tirage, par exemple par génération
au hasard d’un nombre réel entre 1 et N
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
Méthodes de tirage
Tirage systématique
Une autre méthode est celle du tirage systématique : on procède
par "sauts" dans la liste des unités statistiques.
Cette méthode équivaut à la méthode élémentaire si les unités de
la base de sondage sont réparties absolument au hasard ; elle est
plus avantageuse que la méthode élémentaire si les unités ont été
classées suivant un critère (variable auxiliaire) en corrélation avec
les caractères à estimer et si l’on suppose qu’il existe un "effet"
dans l’ordre de classement qui va donner plus de
"représentativité" à l’échantillon tiré.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
Méthodes de tirage
Tirage systématique
Une autre méthode est celle du tirage systématique : on procède
par "sauts" dans la liste des unités statistiques.
Cette méthode équivaut à la méthode élémentaire si les unités de
la base de sondage sont réparties absolument au hasard ; elle est
plus avantageuse que la méthode élémentaire si les unités ont été
classées suivant un critère (variable auxiliaire) en corrélation avec
les caractères à estimer et si l’on suppose qu’il existe un "effet"
dans l’ordre de classement qui va donner plus de
"représentativité" à l’échantillon tiré.
Par exemple, si on a classé des ménages selon leur taille, on sera
assuré par ce mode de tirage d’avoir à la fois des ménages de
faible taille et des ménages de taille importante dans l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
Méthodes de tirage
Tirage systématique
Une autre méthode est celle du tirage systématique : on procède
par "sauts" dans la liste des unités statistiques.
Cette méthode équivaut à la méthode élémentaire si les unités de
la base de sondage sont réparties absolument au hasard ; elle est
plus avantageuse que la méthode élémentaire si les unités ont été
classées suivant un critère (variable auxiliaire) en corrélation avec
les caractères à estimer et si l’on suppose qu’il existe un "effet"
dans l’ordre de classement qui va donner plus de
"représentativité" à l’échantillon tiré.
Par exemple, si on a classé des ménages selon leur taille, on sera
assuré par ce mode de tirage d’avoir à la fois des ménages de
faible taille et des ménages de taille importante dans l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21

Weitere ähnliche Inhalte

Was ist angesagt?

ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)Adad Med Chérif
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée Adad Med Chérif
 
diapo pour soutenance
diapo pour soutenance diapo pour soutenance
diapo pour soutenance sara h
 
Statistique descriptive
Statistique descriptiveStatistique descriptive
Statistique descriptiveeninioo
 
Questionnaire de diagnostic
Questionnaire de diagnosticQuestionnaire de diagnostic
Questionnaire de diagnosticGaroudy Edmond
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité Adad Med Chérif
 
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Adad Med Chérif
 
Indicateurs de santé, cours pour pharmaciens cinquième année 2017
Indicateurs de santé, cours pour pharmaciens cinquième année 2017Indicateurs de santé, cours pour pharmaciens cinquième année 2017
Indicateurs de santé, cours pour pharmaciens cinquième année 2017Faculté de médecine de Tizi-Ouzou
 
Analyse de régression multiple
Analyse de régression multipleAnalyse de régression multiple
Analyse de régression multipleAdad Med Chérif
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et RAB IR
 
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique Adad Med Chérif
 
S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3Jamal Yasser
 
L’Econométrie des Données de Panel
L’Econométrie des Données de PanelL’Econométrie des Données de Panel
L’Econométrie des Données de PanelCherif Allah
 
Soutenance Master Gfery 24oct08
Soutenance Master Gfery 24oct08Soutenance Master Gfery 24oct08
Soutenance Master Gfery 24oct08Guillaume R. Fery
 

Was ist angesagt? (20)

ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée
 
COURS SUR LES SERIES TEMPORELLES
COURS SUR LES SERIES TEMPORELLESCOURS SUR LES SERIES TEMPORELLES
COURS SUR LES SERIES TEMPORELLES
 
diapo pour soutenance
diapo pour soutenance diapo pour soutenance
diapo pour soutenance
 
Test khi deux
Test khi deuxTest khi deux
Test khi deux
 
Statistique descriptive
Statistique descriptiveStatistique descriptive
Statistique descriptive
 
Questionnaire de diagnostic
Questionnaire de diagnosticQuestionnaire de diagnostic
Questionnaire de diagnostic
 
Soutenance memoire simon (2017)
Soutenance memoire simon (2017)Soutenance memoire simon (2017)
Soutenance memoire simon (2017)
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité
 
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
 
Biostatistique
BiostatistiqueBiostatistique
Biostatistique
 
Indicateurs de santé, cours pour pharmaciens cinquième année 2017
Indicateurs de santé, cours pour pharmaciens cinquième année 2017Indicateurs de santé, cours pour pharmaciens cinquième année 2017
Indicateurs de santé, cours pour pharmaciens cinquième année 2017
 
Analyse de régression multiple
Analyse de régression multipleAnalyse de régression multiple
Analyse de régression multiple
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et R
 
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
 
S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3
 
Echantillonnage.pptx
Echantillonnage.pptxEchantillonnage.pptx
Echantillonnage.pptx
 
Moyenne mobile
Moyenne mobile Moyenne mobile
Moyenne mobile
 
L’Econométrie des Données de Panel
L’Econométrie des Données de PanelL’Econométrie des Données de Panel
L’Econométrie des Données de Panel
 
Soutenance Master Gfery 24oct08
Soutenance Master Gfery 24oct08Soutenance Master Gfery 24oct08
Soutenance Master Gfery 24oct08
 

Andere mochten auch

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal hammamiahlem1
 
Echantillon
EchantillonEchantillon
EchantillonKaiogan
 
Maths1 as n1livsol6
Maths1 as n1livsol6Maths1 as n1livsol6
Maths1 as n1livsol6Naima K k
 
Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)FactaMedia
 
otros servicios de internet
otros servicios de internetotros servicios de internet
otros servicios de internetyaalirio
 
Présentation safety tab fr
Présentation safety tab frPrésentation safety tab fr
Présentation safety tab frBenjamin FURLAN
 
Computraining replay
Computraining replayComputraining replay
Computraining replayTns Akblt
 
Autora margaret mahy pptx
Autora margaret mahy pptxAutora margaret mahy pptx
Autora margaret mahy pptxCeip Aragon
 
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...TradeForDevelopment Centre
 
Plateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événementsPlateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événementsDAVID JAMES
 
Los juegos del hambre
Los juegos del hambreLos juegos del hambre
Los juegos del hambrebibliobaralla
 

Andere mochten auch (20)

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal
 
Echantillon
EchantillonEchantillon
Echantillon
 
Enredados socialmente
Enredados socialmenteEnredados socialmente
Enredados socialmente
 
Aguanta el tipo
Aguanta el tipoAguanta el tipo
Aguanta el tipo
 
Maths1 as n1livsol6
Maths1 as n1livsol6Maths1 as n1livsol6
Maths1 as n1livsol6
 
Habilidades Básicas 1
Habilidades Básicas 1Habilidades Básicas 1
Habilidades Básicas 1
 
Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)
 
Blanca navidad
Blanca navidadBlanca navidad
Blanca navidad
 
otros servicios de internet
otros servicios de internetotros servicios de internet
otros servicios de internet
 
Historia cine
Historia cineHistoria cine
Historia cine
 
Présentation safety tab fr
Présentation safety tab frPrésentation safety tab fr
Présentation safety tab fr
 
Computraining replay
Computraining replayComputraining replay
Computraining replay
 
Autora margaret mahy pptx
Autora margaret mahy pptxAutora margaret mahy pptx
Autora margaret mahy pptx
 
Jd
JdJd
Jd
 
Le commerce équitable en Europe de l'Est
Le commerce équitable en Europe de l'EstLe commerce équitable en Europe de l'Est
Le commerce équitable en Europe de l'Est
 
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...
 
Lesson plan
Lesson planLesson plan
Lesson plan
 
Plateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événementsPlateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événements
 
Los juegos del hambre
Los juegos del hambreLos juegos del hambre
Los juegos del hambre
 
Antonio
AntonioAntonio
Antonio
 

Ähnlich wie Chapitre2: Sondage aléatoire simple

chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfAnassFarkadi
 
Chapitre4 Les sondages à probabilité inégales
Chapitre4 Les sondages à probabilité inégalesChapitre4 Les sondages à probabilité inégales
Chapitre4 Les sondages à probabilité inégalesMahamadou Haro
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_amanMehdi Aman
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité Adad Med Chérif
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciwospro-academy
 
Les relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdfLes relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdfisen4Comptabilite
 
Chapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptxChapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptxmelianikholoud
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistiqueSamad Oulasri
 
Metrologie termilnal
Metrologie termilnalMetrologie termilnal
Metrologie termilnalm.a bensaaoud
 
Stat4 Principes Des Tests Statistiques
Stat4  Principes Des Tests StatistiquesStat4  Principes Des Tests Statistiques
Stat4 Principes Des Tests StatistiquesJean-Louis ESTRADE
 
FINAL.pptx
FINAL.pptxFINAL.pptx
FINAL.pptxsara6496
 

Ähnlich wie Chapitre2: Sondage aléatoire simple (20)

chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
 
Chapitre5
Chapitre5Chapitre5
Chapitre5
 
Metrologie
MetrologieMetrologie
Metrologie
 
Metrologie
MetrologieMetrologie
Metrologie
 
Chapitre4 Les sondages à probabilité inégales
Chapitre4 Les sondages à probabilité inégalesChapitre4 Les sondages à probabilité inégales
Chapitre4 Les sondages à probabilité inégales
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité
 
Cours regression 4
Cours regression 4Cours regression 4
Cours regression 4
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon ici
 
Les relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdfLes relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdf
 
Chapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptxChapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptx
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique
 
Metrologie termilnal
Metrologie termilnalMetrologie termilnal
Metrologie termilnal
 
Loic sarton (2)
Loic sarton (2)Loic sarton (2)
Loic sarton (2)
 
Regression simple
Regression simpleRegression simple
Regression simple
 
Stat4 Principes Des Tests Statistiques
Stat4  Principes Des Tests StatistiquesStat4  Principes Des Tests Statistiques
Stat4 Principes Des Tests Statistiques
 
FINAL.pptx
FINAL.pptxFINAL.pptx
FINAL.pptx
 

Kürzlich hochgeladen

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxHadJer61
 

Kürzlich hochgeladen (6)

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptx
 

Chapitre2: Sondage aléatoire simple

  • 1. Les sondages aléatoires simples Mahamadou HARO Ingénieur Statisticien Économiste Séminaire de sondage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 1 / 21
  • 2. Plan de la présentation 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 2 / 21
  • 3. Principe Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 3 / 21
  • 4. Principe Introduction De l’univers on extrait un échantillon de taille n, en accordant à chaque unité statistique la même probabilité d’être tirée. L’échantillon peut être tiré : avec remise : une unité ayant été sélectionnée à un des tirages est "remise dans l’urne de tirage" et participe aux tirages suivants ; elle peut donc être tirée deux fois, ou plus ; sans remise : une fois une unité tirée, elle n’est plus prise en compte pour les tirages suivants (c’est le mode de tirage qui semble le plus "naturel"). Le sondage aléatoire simple est la base de la méthode des sondages, à partir de laquelle sont développées les autres méthodes présentées dans ce manuel. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
  • 5. Principe Introduction De l’univers on extrait un échantillon de taille n, en accordant à chaque unité statistique la même probabilité d’être tirée. L’échantillon peut être tiré : avec remise : une unité ayant été sélectionnée à un des tirages est "remise dans l’urne de tirage" et participe aux tirages suivants ; elle peut donc être tirée deux fois, ou plus ; sans remise : une fois une unité tirée, elle n’est plus prise en compte pour les tirages suivants (c’est le mode de tirage qui semble le plus "naturel"). Le sondage aléatoire simple est la base de la méthode des sondages, à partir de laquelle sont développées les autres méthodes présentées dans ce manuel. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
  • 6. Estimation d’une moyenne Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 5 / 21
  • 7. Estimation d’une moyenne Estimation d’une moyenne Pour estimer la moyenne Y d’une variable Y sur l’univers (Y est bien sûr inconnue) il semble naturel d’utiliser l’estimateur : ¯y = 1 n n i=1 yi (1) moyenne calculée sur les unités de l’échantillon. y est un estimateur sans biais la moyenne de l’universY. Cette propriété peut s’écrire : E(¯y) = ¯Y Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 6 / 21
  • 8. Estimation d’une moyenne Variance de y Dans le cas avec remise : V(¯y) = V(Y) n (2) Dans le cas sans remise : V(¯y) = ( N − n N − 1 ) V(Y) n (3) Ceci veut dire que la variance de l’estimateur sera d’autant plus faible que : a)V(Y) sera faible ; b)la taille de l’échantillon sera importante. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
  • 9. Estimation d’une moyenne Variance de y Dans le cas avec remise : V(¯y) = V(Y) n (2) Dans le cas sans remise : V(¯y) = ( N − n N − 1 ) V(Y) n (3) Ceci veut dire que la variance de l’estimateur sera d’autant plus faible que : a)V(Y) sera faible ; b)la taille de l’échantillon sera importante. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
  • 10. Estimation d’une moyenne Pour un échantillon suffisamment grand, y suit une loi normale À partir d’une certaine taille d’échantillon (disons au moins 30), la distribution de la variable aléatoire y (c’est-à-dire l’ensemble des estimations fournies par tous les échantillons obtenus avec le tirage équiprobable de taille n) s’ajuste sur une loi normale (courbe "en cloche" de Gauss) dont les caractéristiques sont liées aux valeurs E(y) et V(y) étudiées ci-dessus. On sait que la distribution d’une loi normale de moyenne m et d’écart-type σ comprend 95% des valeurs dans l’intervalle [m − 1, 96σ; m + 1, 96σ]. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
  • 11. Estimation d’une moyenne Pour un échantillon suffisamment grand, y suit une loi normale À partir d’une certaine taille d’échantillon (disons au moins 30), la distribution de la variable aléatoire y (c’est-à-dire l’ensemble des estimations fournies par tous les échantillons obtenus avec le tirage équiprobable de taille n) s’ajuste sur une loi normale (courbe "en cloche" de Gauss) dont les caractéristiques sont liées aux valeurs E(y) et V(y) étudiées ci-dessus. On sait que la distribution d’une loi normale de moyenne m et d’écart-type σ comprend 95% des valeurs dans l’intervalle [m − 1, 96σ; m + 1, 96σ]. Ici on peut dire que 95% des valeurs de y sont situées dans l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est donnée par les formules (2) ou (3) ci-dessus. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
  • 12. Estimation d’une moyenne Pour un échantillon suffisamment grand, y suit une loi normale À partir d’une certaine taille d’échantillon (disons au moins 30), la distribution de la variable aléatoire y (c’est-à-dire l’ensemble des estimations fournies par tous les échantillons obtenus avec le tirage équiprobable de taille n) s’ajuste sur une loi normale (courbe "en cloche" de Gauss) dont les caractéristiques sont liées aux valeurs E(y) et V(y) étudiées ci-dessus. On sait que la distribution d’une loi normale de moyenne m et d’écart-type σ comprend 95% des valeurs dans l’intervalle [m − 1, 96σ; m + 1, 96σ]. Ici on peut dire que 95% des valeurs de y sont situées dans l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est donnée par les formules (2) ou (3) ci-dessus. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
  • 13. Estimation d’une moyenne La variance V(y) peut être estimée à partir de l’échantillon Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est inconnue. Celle-ci va être estimée à partir des données observées sur l’échantillon. Si l’on note s2 la grandeur calculée sur l’échantillon : s2 = 1 n − 1 n i=1 (yi − ¯y)2 Alors on a le résultat suivant : dans le cas sans remise, s2 est un estimateur sans biais de N N−1 V(Y) Donc V(y) est estimée sans biais par : ˆV(y) = s2 n dans le cas de tirage avec remise ; ˆV(y) = (1 − n N )s2 n dans le cas du tirage sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
  • 14. Estimation d’une moyenne La variance V(y) peut être estimée à partir de l’échantillon Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est inconnue. Celle-ci va être estimée à partir des données observées sur l’échantillon. Si l’on note s2 la grandeur calculée sur l’échantillon : s2 = 1 n − 1 n i=1 (yi − ¯y)2 Alors on a le résultat suivant : dans le cas sans remise, s2 est un estimateur sans biais de N N−1 V(Y) dans le cas avec remise, s2 est un estimateur sans biais de V(Y). Donc V(y) est estimée sans biais par : ˆV(y) = s2 n dans le cas de tirage avec remise ; ˆV(y) = (1 − n N )s2 n dans le cas du tirage sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
  • 15. Estimation d’une moyenne La variance V(y) peut être estimée à partir de l’échantillon Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est inconnue. Celle-ci va être estimée à partir des données observées sur l’échantillon. Si l’on note s2 la grandeur calculée sur l’échantillon : s2 = 1 n − 1 n i=1 (yi − ¯y)2 Alors on a le résultat suivant : dans le cas sans remise, s2 est un estimateur sans biais de N N−1 V(Y) dans le cas avec remise, s2 est un estimateur sans biais de V(Y). Donc V(y) est estimée sans biais par : ˆV(y) = s2 n dans le cas de tirage avec remise ; ˆV(y) = (1 − n N )s2 n dans le cas du tirage sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
  • 16. Estimation d’une moyenne Dans la pratique on n’a tiré qu’un échantillon Ce qui vient d’être dit aux paragraphes précédents doit être replacé dans cette perspective. Les résultats ci-dessus présentent la manière dont l’ensemble des valeurs calculées sur tous les échantillons possibles se répartissent par rapport à la grandeur recherchée Y. En pratique, le seul résultat dont on dispose est la moyenne y calculée sur un échantillon, et Y est inconnue. On tient un raisonnement analogue au précédent, mais à partir de y, pour fournir un "intervalle de confiance" pour Y. on dispose de la valeur y ; on estime V(y) à partir de l’échantillon, on obtient donc une estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ; Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
  • 17. Estimation d’une moyenne Dans la pratique on n’a tiré qu’un échantillon Ce qui vient d’être dit aux paragraphes précédents doit être replacé dans cette perspective. Les résultats ci-dessus présentent la manière dont l’ensemble des valeurs calculées sur tous les échantillons possibles se répartissent par rapport à la grandeur recherchée Y. En pratique, le seul résultat dont on dispose est la moyenne y calculée sur un échantillon, et Y est inconnue. On tient un raisonnement analogue au précédent, mais à partir de y, pour fournir un "intervalle de confiance" pour Y. on dispose de la valeur y ; on estime V(y) à partir de l’échantillon, on obtient donc une estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ; Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
  • 18. Estimation d’une moyenne Remarques La précision, en termes de variance de y est essentiellement liée au nombre d’unités enquêtées n, et relativement peu au taux de sondage n N (pas du tout dans le cas avec remise). La variance est proportionnelle à 1 n ; l’écart-type, qui permet d’établir l’intervalle de confiance, est proportionnel à 1√ n .Ceci veut dire que pour réduire de moitié l’intervalle de confiance, il faut quatre fois plus de questionnaires. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
  • 19. Estimation d’une moyenne Remarques La précision, en termes de variance de y est essentiellement liée au nombre d’unités enquêtées n, et relativement peu au taux de sondage n N (pas du tout dans le cas avec remise). La variance est proportionnelle à 1 n ; l’écart-type, qui permet d’établir l’intervalle de confiance, est proportionnel à 1√ n .Ceci veut dire que pour réduire de moitié l’intervalle de confiance, il faut quatre fois plus de questionnaires. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
  • 20. Estimation d’une moyenne Combien d’unités enquêter dans l’échantillon ? On voit que la réponse à cette question se trouve dans les formules (2) et (3) : si l’on fixe un niveau de précision (largeur de l’intervalle de confiance, ou coefficient de variation, ce qui signifie une valeur "maxi"" de la variance), on en déduit le nombre d’unités minimum nécessaire. Le problème est que la quantité V(Y) est inconnue avant l’enquête, dans les formules (2) et (3) ; la seule solution est de l’estimer, soit de manière intuitive, soit à partir de données observées sur le passé Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
  • 21. Estimation d’une moyenne Combien d’unités enquêter dans l’échantillon ? On voit que la réponse à cette question se trouve dans les formules (2) et (3) : si l’on fixe un niveau de précision (largeur de l’intervalle de confiance, ou coefficient de variation, ce qui signifie une valeur "maxi"" de la variance), on en déduit le nombre d’unités minimum nécessaire. Le problème est que la quantité V(Y) est inconnue avant l’enquête, dans les formules (2) et (3) ; la seule solution est de l’estimer, soit de manière intuitive, soit à partir de données observées sur le passé ici on se place dans une phase de réflexion en amont de la réalisation sur le terrain). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
  • 22. Estimation d’une moyenne Combien d’unités enquêter dans l’échantillon ? On voit que la réponse à cette question se trouve dans les formules (2) et (3) : si l’on fixe un niveau de précision (largeur de l’intervalle de confiance, ou coefficient de variation, ce qui signifie une valeur "maxi"" de la variance), on en déduit le nombre d’unités minimum nécessaire. Le problème est que la quantité V(Y) est inconnue avant l’enquête, dans les formules (2) et (3) ; la seule solution est de l’estimer, soit de manière intuitive, soit à partir de données observées sur le passé ici on se place dans une phase de réflexion en amont de la réalisation sur le terrain). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
  • 23. Estimation d’un total Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 13 / 21
  • 24. Estimation d’un total Estimation d’un total Les estimations de totaux sont en général des estimations d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total d’une variable Y est estimé, à partir de l’échantillon, par l’ estimateur de sa moyenne multiplié par l’effectif de l’univers : ˆT(Y) = Ny (4) En remplaçant y par son expression, on peut faire apparaître le coefficient d’extrapolation ou la pondération N n de chaque unité de l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
  • 25. Estimation d’un total Estimation d’un total Les estimations de totaux sont en général des estimations d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total d’une variable Y est estimé, à partir de l’échantillon, par l’ estimateur de sa moyenne multiplié par l’effectif de l’univers : ˆT(Y) = Ny (4) En remplaçant y par son expression, on peut faire apparaître le coefficient d’extrapolation ou la pondération N n de chaque unité de l’échantillon. La variance de l’estimateur du total se déduit aisément de celle y en appliquant les propriétés de la variance. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
  • 26. Estimation d’un total Estimation d’un total Les estimations de totaux sont en général des estimations d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total d’une variable Y est estimé, à partir de l’échantillon, par l’ estimateur de sa moyenne multiplié par l’effectif de l’univers : ˆT(Y) = Ny (4) En remplaçant y par son expression, on peut faire apparaître le coefficient d’extrapolation ou la pondération N n de chaque unité de l’échantillon. La variance de l’estimateur du total se déduit aisément de celle y en appliquant les propriétés de la variance. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
  • 27. Estimation d’une proportion Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 15 / 21
  • 28. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 29. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Une des caractéristiques d’une telle variable est que sa variance s’écrit de manière simple :V(Y) = P(1 − P) Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 30. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Une des caractéristiques d’une telle variable est que sa variance s’écrit de manière simple :V(Y) = P(1 − P) Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais sa véritable valeur est inconnue et c’est l’enquête par sondage qui cherche à l’estimer de manière précise), on pourra anticiper la précision en fonction du nombre de questionnaires puisqu’on aura apriori un ordre de grandeur de la variance de Y. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 31. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Une des caractéristiques d’une telle variable est que sa variance s’écrit de manière simple :V(Y) = P(1 − P) Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais sa véritable valeur est inconnue et c’est l’enquête par sondage qui cherche à l’estimer de manière précise), on pourra anticiper la précision en fonction du nombre de questionnaires puisqu’on aura apriori un ordre de grandeur de la variance de Y. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 32. Estimation d’un ratio Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 17 / 21
  • 33. Estimation d’un ratio Estimation d’un ratio L’estimation d’un ratio peut être délicate, et révéler des pièges. Prenons un exemple : supposons que l’univers soit un univers de ménages (la base de sondage est une liste de ménages), et que certaines caractéristiques comme le nombre d’enfants de moins de cinq ans ne soient pas connues. Comment estimer le poids corporel moyen des enfants de moins de cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire simple ? Remarquons que l’unité statistique utilisée pour le sondage est le ménage et non l’individu. On procède ainsi : on estime le nombre total d’enfants de moins de cinq ans ; on estime ensuite le poids corporel total des enfants de moins de cinq ans Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
  • 34. Estimation d’un ratio Estimation d’un ratio L’estimation d’un ratio peut être délicate, et révéler des pièges. Prenons un exemple : supposons que l’univers soit un univers de ménages (la base de sondage est une liste de ménages), et que certaines caractéristiques comme le nombre d’enfants de moins de cinq ans ne soient pas connues. Comment estimer le poids corporel moyen des enfants de moins de cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire simple ? Remarquons que l’unité statistique utilisée pour le sondage est le ménage et non l’individu. On procède ainsi : on estime le nombre total d’enfants de moins de cinq ans ; on estime ensuite le poids corporel total des enfants de moins de cinq ans le ratio (ou quotient) de ces deux masses est l’estimation du poids moyen de l’univers ; des enfants de moins de cinq ans. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
  • 35. Estimation d’un ratio Estimation d’un ratio L’estimation d’un ratio peut être délicate, et révéler des pièges. Prenons un exemple : supposons que l’univers soit un univers de ménages (la base de sondage est une liste de ménages), et que certaines caractéristiques comme le nombre d’enfants de moins de cinq ans ne soient pas connues. Comment estimer le poids corporel moyen des enfants de moins de cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire simple ? Remarquons que l’unité statistique utilisée pour le sondage est le ménage et non l’individu. On procède ainsi : on estime le nombre total d’enfants de moins de cinq ans ; on estime ensuite le poids corporel total des enfants de moins de cinq ans le ratio (ou quotient) de ces deux masses est l’estimation du poids moyen de l’univers ; des enfants de moins de cinq ans. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
  • 36. Méthodes de tirage Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 19 / 21
  • 37. Méthodes de tirage Méthode simple L’idée est de numéroter les unités statistiques, et de procéder à un tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut utiliser : une table de nombre au hasard,qu’on parcourt dans le sens bien défini au départ, par exemple ligne par ligne ; Un algorithme informatique de tirage, par exemple par génération au hasard d’un nombre réel entre 1 et N Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
  • 38. Méthodes de tirage Méthode simple L’idée est de numéroter les unités statistiques, et de procéder à un tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut utiliser : une table de nombre au hasard,qu’on parcourt dans le sens bien défini au départ, par exemple ligne par ligne ; Un algorithme informatique de tirage, par exemple par génération au hasard d’un nombre réel entre 1 et N Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
  • 39. Méthodes de tirage Tirage systématique Une autre méthode est celle du tirage systématique : on procède par "sauts" dans la liste des unités statistiques. Cette méthode équivaut à la méthode élémentaire si les unités de la base de sondage sont réparties absolument au hasard ; elle est plus avantageuse que la méthode élémentaire si les unités ont été classées suivant un critère (variable auxiliaire) en corrélation avec les caractères à estimer et si l’on suppose qu’il existe un "effet" dans l’ordre de classement qui va donner plus de "représentativité" à l’échantillon tiré. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
  • 40. Méthodes de tirage Tirage systématique Une autre méthode est celle du tirage systématique : on procède par "sauts" dans la liste des unités statistiques. Cette méthode équivaut à la méthode élémentaire si les unités de la base de sondage sont réparties absolument au hasard ; elle est plus avantageuse que la méthode élémentaire si les unités ont été classées suivant un critère (variable auxiliaire) en corrélation avec les caractères à estimer et si l’on suppose qu’il existe un "effet" dans l’ordre de classement qui va donner plus de "représentativité" à l’échantillon tiré. Par exemple, si on a classé des ménages selon leur taille, on sera assuré par ce mode de tirage d’avoir à la fois des ménages de faible taille et des ménages de taille importante dans l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
  • 41. Méthodes de tirage Tirage systématique Une autre méthode est celle du tirage systématique : on procède par "sauts" dans la liste des unités statistiques. Cette méthode équivaut à la méthode élémentaire si les unités de la base de sondage sont réparties absolument au hasard ; elle est plus avantageuse que la méthode élémentaire si les unités ont été classées suivant un critère (variable auxiliaire) en corrélation avec les caractères à estimer et si l’on suppose qu’il existe un "effet" dans l’ordre de classement qui va donner plus de "représentativité" à l’échantillon tiré. Par exemple, si on a classé des ménages selon leur taille, on sera assuré par ce mode de tirage d’avoir à la fois des ménages de faible taille et des ménages de taille importante dans l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21