1. Les sondages à probabilités inégales
Mahamadou HARO
Ingénieur Statisticien Économiste
Séminaire de sondage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14
2. Plan de la présentation
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14
3. Principe
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14
4. Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
5. Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
6. Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
7. Formules d’estimation dans le cas avec remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14
8. Formules d’estimation dans le cas avec remise
Formules d’estimation dans le cas avec remise
Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacun
des tirages et on tire un échantillon de taille n. On a N
α=1 Aα = 1
(donc chaque Aα , est inférieur à 1 et souvent de valeur très faible).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14
9. Formules d’estimation dans le cas avec remise
Estimation d’un total
L’estimateur du total de la variable Y (sur l’univers) proposé à partir de
l’échantillon tiré est :
ˆT(Y) =
1
n
n
i=1
yi
Ai
(1)
Où yi est la valeur de la variable Y pour l’unité sélectionnée au ième
tirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tient
donc compte des probabilités de tirage différentes pour produire
l’estimation du total. Cet estimateur est sans biais :
E(ˆT(Y)) =
N
α=1
Yα
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14
10. Formules d’estimation dans le cas avec remise
Estimation d’une moyenne, d’un ratio
Pour estimer la moyenne Y on utilise l’estimateur
ˆT(Y)
N
Sa variance est :
V
ˆT(Y)
N
=
1
N2
V(ˆT(Y))
Un ratio est estimé comme le rapport de l’estimation de deux masses.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14
11. Méthodes de tirage
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14
12. Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
13. Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
14. Aperçu sur le sondage à probabilités inégales sans remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14
15. Aperçu sur le sondage à probabilités inégales sans remise
Aperçu sur le sondage à probabilités inégales sans
remise
Le modèle qui a été appliqué précédemment pour produire un
estimateur est beaucoup plus difficile à utiliser : en effet, les
probabilités de tirage se déforment au fur et à mesure qu’on réalise les
tirages.
Au premier tirage A1
i = Ai ;
Au deuxième tirage A2
j =
A1
j
1−A1
i
sachant que c’est i qui a été tiré au
premier tirage ; etc.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14
16. Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
17. Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
18. Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
19. Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
20. Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14