SlideShare ist ein Scribd-Unternehmen logo
1 von 20
Downloaden Sie, um offline zu lesen
Les sondages à probabilités inégales
Mahamadou HARO
Ingénieur Statisticien Économiste
Séminaire de sondage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14
Plan de la présentation
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14
Principe
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Formules d’estimation dans le cas avec remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14
Formules d’estimation dans le cas avec remise
Formules d’estimation dans le cas avec remise
Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacun
des tirages et on tire un échantillon de taille n. On a N
α=1 Aα = 1
(donc chaque Aα , est inférieur à 1 et souvent de valeur très faible).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14
Formules d’estimation dans le cas avec remise
Estimation d’un total
L’estimateur du total de la variable Y (sur l’univers) proposé à partir de
l’échantillon tiré est :
ˆT(Y) =
1
n
n
i=1
yi
Ai
(1)
Où yi est la valeur de la variable Y pour l’unité sélectionnée au ième
tirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tient
donc compte des probabilités de tirage différentes pour produire
l’estimation du total. Cet estimateur est sans biais :
E(ˆT(Y)) =
N
α=1
Yα
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14
Formules d’estimation dans le cas avec remise
Estimation d’une moyenne, d’un ratio
Pour estimer la moyenne Y on utilise l’estimateur
ˆT(Y)
N
Sa variance est :
V
ˆT(Y)
N
=
1
N2
V(ˆT(Y))
Un ratio est estimé comme le rapport de l’estimation de deux masses.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14
Méthodes de tirage
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14
Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Aperçu sur le sondage à probabilités inégales sans
remise
Le modèle qui a été appliqué précédemment pour produire un
estimateur est beaucoup plus difficile à utiliser : en effet, les
probabilités de tirage se déforment au fur et à mesure qu’on réalise les
tirages.
Au premier tirage A1
i = Ai ;
Au deuxième tirage A2
j =
A1
j
1−A1
i
sachant que c’est i qui a été tiré au
premier tirage ; etc.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14
Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14

Weitere ähnliche Inhalte

Was ist angesagt?

Méthodes décisionnelles pour la sécurité
Méthodes décisionnelles pour la sécuritéMéthodes décisionnelles pour la sécurité
Méthodes décisionnelles pour la sécuritéMohamed Heny SELMI
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesJaouad Dabounou
 
Analyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afcAnalyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afcRémi Bachelet
 
regression_logistique.pdf
regression_logistique.pdfregression_logistique.pdf
regression_logistique.pdfSidiAbdallah1
 
Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal hammamiahlem1
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et RAB IR
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMJaouad Dabounou
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
cours de complexité algorithmique
cours de complexité algorithmiquecours de complexité algorithmique
cours de complexité algorithmiqueAtef MASMOUDI
 
Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...Digital Thursday
 
La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce Nour El Houda Megherbi
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
5.3 Régression logistique
5.3 Régression logistique5.3 Régression logistique
5.3 Régression logistiqueBoris Guarisma
 
Management de projet
Management de projetManagement de projet
Management de projetEric Métais
 
Analyse de données avec R : Une petite introduction
Analyse de données avec R : Une petite introductionAnalyse de données avec R : Une petite introduction
Analyse de données avec R : Une petite introductionAhmadou DICKO
 

Was ist angesagt? (20)

Méthodes décisionnelles pour la sécurité
Méthodes décisionnelles pour la sécuritéMéthodes décisionnelles pour la sécurité
Méthodes décisionnelles pour la sécurité
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des Correspondances
 
Analyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afcAnalyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afc
 
regression_logistique.pdf
regression_logistique.pdfregression_logistique.pdf
regression_logistique.pdf
 
120118 cv cateura-fr
120118 cv cateura-fr120118 cv cateura-fr
120118 cv cateura-fr
 
Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal
 
ségmentation d'image
ségmentation d'imageségmentation d'image
ségmentation d'image
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et R
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTM
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
cours de complexité algorithmique
cours de complexité algorithmiquecours de complexité algorithmique
cours de complexité algorithmique
 
Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...
 
La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
5.3 Régression logistique
5.3 Régression logistique5.3 Régression logistique
5.3 Régression logistique
 
Methodologie des enquete
Methodologie des enqueteMethodologie des enquete
Methodologie des enquete
 
Management de projet
Management de projetManagement de projet
Management de projet
 
Analyse de données avec R : Une petite introduction
Analyse de données avec R : Une petite introductionAnalyse de données avec R : Une petite introduction
Analyse de données avec R : Une petite introduction
 
Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Td dw1
Td dw1Td dw1
Td dw1
 

Andere mochten auch

Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Gael Varoquaux
 
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Nicolas SORHAITZ
 
Aiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibAiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibGael Varoquaux
 
Je configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsJe configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsRonan Amicel
 
Scikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonScikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonGael Varoquaux
 
Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Gael Varoquaux
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLParis, France
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown Cdiscount
 
Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Emeric Tapachès
 
Python et les bases de données non sql
Python et les bases de données non sqlPython et les bases de données non sql
Python et les bases de données non sqlbchesneau
 
Data Entry in CSpro
Data Entry in CSproData Entry in CSpro
Data Entry in CSproprabhustat
 
pandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statisticspandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and StatisticsWes McKinney
 
pandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Pythonpandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for PythonWes McKinney
 
Simple big data, in Python
Simple big data, in PythonSimple big data, in Python
Simple big data, in PythonGael Varoquaux
 
Chap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonChap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonMohammed TAMALI
 
Bulletin mensuel de l'ONDRP - 12/14
Bulletin mensuel de l'ONDRP - 12/14Bulletin mensuel de l'ONDRP - 12/14
Bulletin mensuel de l'ONDRP - 12/14FactaMedia
 

Andere mochten auch (20)

Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
 
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
 
Aiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibAiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblib
 
Je configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsJe configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtools
 
Python et NoSQL
Python et NoSQLPython et NoSQL
Python et NoSQL
 
Scikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonScikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en Python
 
Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016
 
Python packaging
Python packagingPython packaging
Python packaging
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQL
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown
 
Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2
 
Python et les bases de données non sql
Python et les bases de données non sqlPython et les bases de données non sql
Python et les bases de données non sql
 
R versur Python
R versur PythonR versur Python
R versur Python
 
Data Entry in CSpro
Data Entry in CSproData Entry in CSpro
Data Entry in CSpro
 
pandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statisticspandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statistics
 
pandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Pythonpandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Python
 
Simple big data, in Python
Simple big data, in PythonSimple big data, in Python
Simple big data, in Python
 
Slides udm-080910
Slides udm-080910Slides udm-080910
Slides udm-080910
 
Chap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonChap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec python
 
Bulletin mensuel de l'ONDRP - 12/14
Bulletin mensuel de l'ONDRP - 12/14Bulletin mensuel de l'ONDRP - 12/14
Bulletin mensuel de l'ONDRP - 12/14
 

Chapitre4 Les sondages à probabilité inégales

  • 1. Les sondages à probabilités inégales Mahamadou HARO Ingénieur Statisticien Économiste Séminaire de sondage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14
  • 2. Plan de la présentation 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14
  • 3. Principe Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14
  • 4. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 5. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. A l’intérieur d’un sondage à probabilités inégales on peut distinguer deux cas selon le mode de tirage des unités. Dans le cas d’un tirage avec remise, la probabilité de tirage est souvent proportionnelle à une mesure de taille et il est possible de calculer les estimations ainsi que les précisions. Par contre le mode de tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 6. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. A l’intérieur d’un sondage à probabilités inégales on peut distinguer deux cas selon le mode de tirage des unités. Dans le cas d’un tirage avec remise, la probabilité de tirage est souvent proportionnelle à une mesure de taille et il est possible de calculer les estimations ainsi que les précisions. Par contre le mode de tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 7. Formules d’estimation dans le cas avec remise Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14
  • 8. Formules d’estimation dans le cas avec remise Formules d’estimation dans le cas avec remise Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacun des tirages et on tire un échantillon de taille n. On a N α=1 Aα = 1 (donc chaque Aα , est inférieur à 1 et souvent de valeur très faible). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14
  • 9. Formules d’estimation dans le cas avec remise Estimation d’un total L’estimateur du total de la variable Y (sur l’univers) proposé à partir de l’échantillon tiré est : ˆT(Y) = 1 n n i=1 yi Ai (1) Où yi est la valeur de la variable Y pour l’unité sélectionnée au ième tirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tient donc compte des probabilités de tirage différentes pour produire l’estimation du total. Cet estimateur est sans biais : E(ˆT(Y)) = N α=1 Yα Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14
  • 10. Formules d’estimation dans le cas avec remise Estimation d’une moyenne, d’un ratio Pour estimer la moyenne Y on utilise l’estimateur ˆT(Y) N Sa variance est : V ˆT(Y) N = 1 N2 V(ˆT(Y)) Un ratio est estimé comme le rapport de l’estimation de deux masses. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14
  • 11. Méthodes de tirage Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14
  • 12. Méthodes de tirage Méthodes de tirage Méthode des chiffres cumulés ; Méthodes aréolaires utilisant des grilles de points. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
  • 13. Méthodes de tirage Méthodes de tirage Méthode des chiffres cumulés ; Méthodes aréolaires utilisant des grilles de points. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
  • 14. Aperçu sur le sondage à probabilités inégales sans remise Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14
  • 15. Aperçu sur le sondage à probabilités inégales sans remise Aperçu sur le sondage à probabilités inégales sans remise Le modèle qui a été appliqué précédemment pour produire un estimateur est beaucoup plus difficile à utiliser : en effet, les probabilités de tirage se déforment au fur et à mesure qu’on réalise les tirages. Au premier tirage A1 i = Ai ; Au deuxième tirage A2 j = A1 j 1−A1 i sachant que c’est i qui a été tiré au premier tirage ; etc. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14
  • 16. Aperçu sur le sondage à probabilités inégales sans remise L’estimateur de Howitz-Thompson On fait donc appel à une autre approche, que nous présenterons rapidement : celle de Horvitz-Thompson. Le point de départ de cette approche développée pour les tirages sans remise est la probabilité d’inclusion : Πi probabilité que i appartienne à l’échantillon, Πij probabilité que i et j) soient simultanément dans l’échantillon. Remarquons que si l’échantillon s est de taille fixe n, alors : N α=1 Πα = n L’estimateur de Horvitz-Thompson du total est ˆT(Y) = i∈s yi Πi Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
  • 17. Aperçu sur le sondage à probabilités inégales sans remise L’estimateur de Howitz-Thompson On fait donc appel à une autre approche, que nous présenterons rapidement : celle de Horvitz-Thompson. Le point de départ de cette approche développée pour les tirages sans remise est la probabilité d’inclusion : Πi probabilité que i appartienne à l’échantillon, Πij probabilité que i et j) soient simultanément dans l’échantillon. Remarquons que si l’échantillon s est de taille fixe n, alors : N α=1 Πα = n L’estimateur de Horvitz-Thompson du total est ˆT(Y) = i∈s yi Πi Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
  • 18. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
  • 19. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Certains auteurs ont, par ailleurs, proposé des formules d’approximation de la variance de l’estimateur de Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche est une approche générale, pas seulement limitée aux sondages à probabilités inégales ; elle est présentée dans ce chapitre car étant la seule utilisable quand on tire à probabilités inégales sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
  • 20. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Certains auteurs ont, par ailleurs, proposé des formules d’approximation de la variance de l’estimateur de Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche est une approche générale, pas seulement limitée aux sondages à probabilités inégales ; elle est présentée dans ce chapitre car étant la seule utilisable quand on tire à probabilités inégales sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14