SlideShare ist ein Scribd-Unternehmen logo
1 von 23
Downloaden Sie, um offline zu lesen
Wprowadzenie
                 Estymatory bezpośrednie
                    Estymatory pośrednie
                          Podsumowanie
                               Literatura




              Statystyka Małych Obszarów
                w badaniach próbkowych

                           Łukasz Wawrowski
                        l.wawrowski@stat.gov.pl

                        Urząd Statystyczny w Poznaniu
                            SKN Estymator, UEP


                                    5.03.2012



Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                       Estymatory bezpośrednie
                          Estymatory pośrednie
                                Podsumowanie
                                     Literatura




1   Wprowadzenie
     Podstawowe pojęcia
     Badanie

2   Estymatory bezpośrednie
      Estymator Horwitza-Thompsona
      Estymator regresyjny

3   Estymatory pośrednie
      Broad Area Ratio Estimator

4   Podsumowanie

5   Literatura


      Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Podstawowe pojęcia
                         Estymatory pośrednie
                                                 Badanie
                               Podsumowanie
                                    Literatura




Statystyka Małych Obszarów
     gałąź metody reprezentacyjnej,
    przedmiotem zainteresowania charakterystki podpopulacji,
    szacowanie dziedzin nie objętych planem losowania,
    losowa liczebność domeny w próbie,
    szacunki nawet przy zerowej liczbności próby w podpopulacji,
    wykorzystanie wszystkich dostępnych źródeł danych.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Podstawowe pojęcia
                         Estymatory pośrednie
                                                 Badanie
                               Podsumowanie
                                    Literatura




Statystyka Małych Obszarów
     gałąź metody reprezentacyjnej,
    przedmiotem zainteresowania charakterystki podpopulacji,
    szacowanie dziedzin nie objętych planem losowania,
    losowa liczebność domeny w próbie,
    szacunki nawet przy zerowej liczbności próby w podpopulacji,
    wykorzystanie wszystkich dostępnych źródeł danych.

Mały obszar
Domena (obszar geograficzny, typ przedsiębiorstwa, grupa
wiekowa), której liczebność w próbie jest mała.


     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Podstawowe pojęcia
                         Estymatory pośrednie
                                                 Badanie
                               Podsumowanie
                                    Literatura




Estymator bezpośredni
Estymator bezpośredni wykorzystuje informacje o zmiennej badanej
y pochodzące wyłącznie z domeny będącej przedmiotem badania
w danym momencie czasu.
    Mała liczebność próby ⇒ duża wariancja,
    ale nieobciążony,
    więc wykorzystywany przy tworzeniu estymatorów pośrednich.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Podstawowe pojęcia
                         Estymatory pośrednie
                                                 Badanie
                               Podsumowanie
                                    Literatura




Estymator pośredni
Estymator pośredni wykorzystuje informacje o wartościach
zmiennej badanej y spoza okresu i domeny będącej przedmiotem
zainteresowania.
    Obciążony, ale niska wariancja,
    „pożycza moc” spoza domeny przy spełnionych założeniach.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Podstawowe pojęcia
                         Estymatory pośrednie
                                                 Badanie
                               Podsumowanie
                                    Literatura




Opis badania
Celem badania było poznanie odsetka studentów zaliczających
praktyki zgodnie z regulaminem studiów.
    Liczebność populacji: 308 osób,
    liczebność próby: 62 osoby (20%),
    badana domena: wydział.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                     Estymatory bezpośrednie
                                                Podstawowe pojęcia
                        Estymatory pośrednie
                                                Badanie
                              Podsumowanie
                                   Literatura




Przygotowanie zbioru
library(TeachingSampling)
dane=read.csv(file="ankieta.csv")
los=sample(dane$id, 62, replace=F)
dane_los=dane[los,]
p=rep(nrow(dane_los)/nrow(dane), nrow(dane_los))
dane_los=cbind(dane_los, p)




    Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                     Estymatory bezpośrednie
                                                Podstawowe pojęcia
                        Estymatory pośrednie
                                                Badanie
                              Podsumowanie
                                   Literatura




Przygotowanie zbioru
dane1=dane_los[dane_los$m5==1,                       ]   #WE
dane2=dane_los[dane_los$m5==2,                       ]   #WIGE
dane3=dane_los[dane_los$m5==3,                       ]   #WGM
dane4=dane_los[dane_los$m5==4,                       ]   #WT
dane5=dane_los[dane_los$m5==5,                       ]   #WZ




    Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                 Estymatory bezpośrednie
                                            Podstawowe pojęcia
                    Estymatory pośrednie
                                            Badanie
                          Podsumowanie
                               Literatura




                              Tablica: Częstości
                    Populacja                          Próba
         Wydział
                   N Tak Nie                        n Tak Nie
         WE      112    96 16                      18    17  1
         WIGE     28    24    4                     7      6 1
         WGM      58    45 13                      13    12  1
         WT       22    20    2                     4      4 0
         WZ       88    75 13                      20    18  2
              Źródło: opracowanie                  własne.




Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                   Estymator Horwitza-Thompsona
                         Estymatory pośrednie
                                                   Estymator regresyjny
                               Podsumowanie
                                    Literatura




Estymator Horwitza-Thompsona
                                                        yi
                                     ˆ HT
                                     yd =                  ,                                 (1)
                                                        πi
                                                 i∈sd

gdzie: πi - prawdopodobieństwo wylosowania i-tego elementu do
próby.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl      Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Estymator Horwitza-Thompsona
                         Estymatory pośrednie
                                                 Estymator regresyjny
                               Podsumowanie
                                    Literatura




Jak w R?
Funkcja:

E.SI(N, n, y)

Argumenty:
N - wielkość populacji,
n - wielkość próby,
y - wektor zawierający dane jednostkowe zmiennej objaśnianej.
Wynik:
wartość wyestymowana, wariancja, współczynnik zmienności.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Estymator Horwitza-Thompsona
                         Estymatory pośrednie
                                                 Estymator regresyjny
                               Podsumowanie
                                    Literatura




Przykład
Estymacja liczby osób, które odbyły praktykę zgodnie
z regulaminem na Wydziale Gospodarki Międzynarodowej.

E.SI(N=58, n=nrow(dane3), dane3$q1_tak)

                   y
Estimation 53.538462
Variance   15.443787
CVE         7.340253




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Estymator Horwitza-Thompsona
                         Estymatory pośrednie
                                                 Estymator regresyjny
                               Podsumowanie
                                    Literatura




GREG
                       yd            ˆ
                       ˆ GREG = yd + βd (xd − xd ),
                                ˆ HT          ˆHT                                          (2)
       ˆ
gdzie: βd - współczynnik regresji między zmienną objaśnianą,
a zmiennymi dodatkowymi.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Estymator Horwitza-Thompsona
                         Estymatory pośrednie
                                                 Estymator regresyjny
                               Podsumowanie
                                    Literatura




Jak w R?
Funkcja:

E.Beta(y, x, Pik, ck=1, b0=FALSE)
GREG.SI(N, n, y, x, tx, b, b0=FALSE)

Argumenty:
x - macierz zawierająca zmienne dodatkowe,
Pik - wektor prawdopodobieństw dostania się do próby,
ck - wektor wag,
tx - wielkość populacji zmiennych dodatkowych,
b0 - wyraz wolny.
Wynik:
wartość wyestymowana, wariancja, współczynnik zmienności.


     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                                                 Estymator Horwitza-Thompsona
                         Estymatory pośrednie
                                                 Estymator regresyjny
                               Podsumowanie
                                    Literatura




Przykład
Estymacja liczby osób, które odbyły praktykę zgodnie
z regulaminem na Wydziale Gospodarki Międzynarodowej
z wykorzystaniem zmiennych dodatkowych: płeć oraz
doświadczenie.

dane_pom=cbind(dane3$q3, dane3$m1)
b=E.Beta(dane3$q1_tak,dane_pom,dane3$p,b0=T)
GREG.SI(58,nrow(dane3),dane3$q1_tak,dane_pom,58,b,b0=T)

                   y
Estimation 58.000000
Variance   13.384615
CVE         6.307757

     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                         Estymatory pośrednie    Broad Area Ratio Estimator
                               Podsumowanie
                                    Literatura




Broad Area Ratio Estimator (BARE)
                                  ˆ HT
                                  yd
                                  ˆ BARE =
                                  yd   nd ,                                                (3)
                                   N
gdzie: N - populacja dużego obszaru, nd - populacja małego
obszaru.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                     Estymatory bezpośrednie
                        Estymatory pośrednie    Broad Area Ratio Estimator
                              Podsumowanie
                                   Literatura




Jak w R?
BARE.SI=function(N, n, nd, y){
  Total <- matrix(NA, nrow = 3, ncol = 1)
  rownames(Total) = c("Estimation", "Variance", "CVE")
  colnames(Total) = "y"
  ht=E.SI(N, n, y)
  BARE=(ht[1,1]/N)*nd
  var=((nd/N)^2)*ht[2,1]
  Cve=100*sqrt(var)/BARE
  Total[,1]=c(BARE, var, Cve)
  return(Total)
}



    Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                         Estymatory pośrednie    Broad Area Ratio Estimator
                               Podsumowanie
                                    Literatura




Przykład
Estymacja liczby osób, które odbyły praktykę zgodnie
z regulaminem na Wydziale Gospodarki Międzynarodowej
z wykorzystaniem wiedzy na temat całej populacji.

BARE.SI(N=308, n=62, nd=58, dane_los$q1_tak)

                   y
Estimation 53.322581
Variance    3.265668
CVE         3.389026




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                         Estymatory pośrednie
                               Podsumowanie
                                    Literatura




Zastosowanie
Statystyka Małych Obszarów wykorzystywana jest
    w sytuacjach, w których tradycyjne metody okazują się
    niewydolne i nieekonomiczne,
    kiedy istnieje zapotrzebowanie na informację na niskim
    poziemie agregacji przestrzennej,
    przy ograniczonym budżecie.




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                      Estymatory bezpośrednie
                         Estymatory pośrednie
                               Podsumowanie
                                    Literatura




Podsumowanie
W prezentacji został przedstawiony zarys SMO oraz
randomizacyjne podejście do estymacji. Oprócz niego w SMO
wyróżnia się także:
    podejście modelowe,
    podejście bayesowskie.
O czym innym razem... ¨




     Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                 Estymatory bezpośrednie
                    Estymatory pośrednie
                          Podsumowanie
                               Literatura




Australian Bureau of Statistics, 2006, A Guide to Small Area
Estimation, Australia.
Paradysz J., 2009, Kryteria dobroci estymacji dla małych
obszarów, Poznań.
Rao J.N.K., 2003, Small Area Estimation, John Wiley & Sons,
New York.
Żądło T., 2008, Elementy statystyki małych obszarów
z programem R, Wydawnictwo Akademii Ekonomicznej
im. Karola Adamieckiego, Katowice.




Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych
Wprowadzenie
                 Estymatory bezpośrednie
                    Estymatory pośrednie
                          Podsumowanie
                               Literatura




                            Dziękuje za uwagę.




Łukasz Wawrowski l.wawrowski@stat.gov.pl    Statystyka Małych Obszarów w badaniach próbkowych

Weitere ähnliche Inhalte

Empfohlen

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Empfohlen (20)

Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 

SAE - Łukasz Wawrowski

  • 1. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Podsumowanie Literatura Statystyka Małych Obszarów w badaniach próbkowych Łukasz Wawrowski l.wawrowski@stat.gov.pl Urząd Statystyczny w Poznaniu SKN Estymator, UEP 5.03.2012 Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 2. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Podsumowanie Literatura 1 Wprowadzenie Podstawowe pojęcia Badanie 2 Estymatory bezpośrednie Estymator Horwitza-Thompsona Estymator regresyjny 3 Estymatory pośrednie Broad Area Ratio Estimator 4 Podsumowanie 5 Literatura Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 3. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Statystyka Małych Obszarów gałąź metody reprezentacyjnej, przedmiotem zainteresowania charakterystki podpopulacji, szacowanie dziedzin nie objętych planem losowania, losowa liczebność domeny w próbie, szacunki nawet przy zerowej liczbności próby w podpopulacji, wykorzystanie wszystkich dostępnych źródeł danych. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 4. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Statystyka Małych Obszarów gałąź metody reprezentacyjnej, przedmiotem zainteresowania charakterystki podpopulacji, szacowanie dziedzin nie objętych planem losowania, losowa liczebność domeny w próbie, szacunki nawet przy zerowej liczbności próby w podpopulacji, wykorzystanie wszystkich dostępnych źródeł danych. Mały obszar Domena (obszar geograficzny, typ przedsiębiorstwa, grupa wiekowa), której liczebność w próbie jest mała. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 5. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Estymator bezpośredni Estymator bezpośredni wykorzystuje informacje o zmiennej badanej y pochodzące wyłącznie z domeny będącej przedmiotem badania w danym momencie czasu. Mała liczebność próby ⇒ duża wariancja, ale nieobciążony, więc wykorzystywany przy tworzeniu estymatorów pośrednich. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 6. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Estymator pośredni Estymator pośredni wykorzystuje informacje o wartościach zmiennej badanej y spoza okresu i domeny będącej przedmiotem zainteresowania. Obciążony, ale niska wariancja, „pożycza moc” spoza domeny przy spełnionych założeniach. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 7. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Opis badania Celem badania było poznanie odsetka studentów zaliczających praktyki zgodnie z regulaminem studiów. Liczebność populacji: 308 osób, liczebność próby: 62 osoby (20%), badana domena: wydział. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 8. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Przygotowanie zbioru library(TeachingSampling) dane=read.csv(file="ankieta.csv") los=sample(dane$id, 62, replace=F) dane_los=dane[los,] p=rep(nrow(dane_los)/nrow(dane), nrow(dane_los)) dane_los=cbind(dane_los, p) Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 9. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Przygotowanie zbioru dane1=dane_los[dane_los$m5==1, ] #WE dane2=dane_los[dane_los$m5==2, ] #WIGE dane3=dane_los[dane_los$m5==3, ] #WGM dane4=dane_los[dane_los$m5==4, ] #WT dane5=dane_los[dane_los$m5==5, ] #WZ Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 10. Wprowadzenie Estymatory bezpośrednie Podstawowe pojęcia Estymatory pośrednie Badanie Podsumowanie Literatura Tablica: Częstości Populacja Próba Wydział N Tak Nie n Tak Nie WE 112 96 16 18 17 1 WIGE 28 24 4 7 6 1 WGM 58 45 13 13 12 1 WT 22 20 2 4 4 0 WZ 88 75 13 20 18 2 Źródło: opracowanie własne. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 11. Wprowadzenie Estymatory bezpośrednie Estymator Horwitza-Thompsona Estymatory pośrednie Estymator regresyjny Podsumowanie Literatura Estymator Horwitza-Thompsona yi ˆ HT yd = , (1) πi i∈sd gdzie: πi - prawdopodobieństwo wylosowania i-tego elementu do próby. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 12. Wprowadzenie Estymatory bezpośrednie Estymator Horwitza-Thompsona Estymatory pośrednie Estymator regresyjny Podsumowanie Literatura Jak w R? Funkcja: E.SI(N, n, y) Argumenty: N - wielkość populacji, n - wielkość próby, y - wektor zawierający dane jednostkowe zmiennej objaśnianej. Wynik: wartość wyestymowana, wariancja, współczynnik zmienności. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 13. Wprowadzenie Estymatory bezpośrednie Estymator Horwitza-Thompsona Estymatory pośrednie Estymator regresyjny Podsumowanie Literatura Przykład Estymacja liczby osób, które odbyły praktykę zgodnie z regulaminem na Wydziale Gospodarki Międzynarodowej. E.SI(N=58, n=nrow(dane3), dane3$q1_tak) y Estimation 53.538462 Variance 15.443787 CVE 7.340253 Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 14. Wprowadzenie Estymatory bezpośrednie Estymator Horwitza-Thompsona Estymatory pośrednie Estymator regresyjny Podsumowanie Literatura GREG yd ˆ ˆ GREG = yd + βd (xd − xd ), ˆ HT ˆHT (2) ˆ gdzie: βd - współczynnik regresji między zmienną objaśnianą, a zmiennymi dodatkowymi. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 15. Wprowadzenie Estymatory bezpośrednie Estymator Horwitza-Thompsona Estymatory pośrednie Estymator regresyjny Podsumowanie Literatura Jak w R? Funkcja: E.Beta(y, x, Pik, ck=1, b0=FALSE) GREG.SI(N, n, y, x, tx, b, b0=FALSE) Argumenty: x - macierz zawierająca zmienne dodatkowe, Pik - wektor prawdopodobieństw dostania się do próby, ck - wektor wag, tx - wielkość populacji zmiennych dodatkowych, b0 - wyraz wolny. Wynik: wartość wyestymowana, wariancja, współczynnik zmienności. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 16. Wprowadzenie Estymatory bezpośrednie Estymator Horwitza-Thompsona Estymatory pośrednie Estymator regresyjny Podsumowanie Literatura Przykład Estymacja liczby osób, które odbyły praktykę zgodnie z regulaminem na Wydziale Gospodarki Międzynarodowej z wykorzystaniem zmiennych dodatkowych: płeć oraz doświadczenie. dane_pom=cbind(dane3$q3, dane3$m1) b=E.Beta(dane3$q1_tak,dane_pom,dane3$p,b0=T) GREG.SI(58,nrow(dane3),dane3$q1_tak,dane_pom,58,b,b0=T) y Estimation 58.000000 Variance 13.384615 CVE 6.307757 Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 17. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Broad Area Ratio Estimator Podsumowanie Literatura Broad Area Ratio Estimator (BARE) ˆ HT yd ˆ BARE = yd nd , (3) N gdzie: N - populacja dużego obszaru, nd - populacja małego obszaru. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 18. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Broad Area Ratio Estimator Podsumowanie Literatura Jak w R? BARE.SI=function(N, n, nd, y){ Total <- matrix(NA, nrow = 3, ncol = 1) rownames(Total) = c("Estimation", "Variance", "CVE") colnames(Total) = "y" ht=E.SI(N, n, y) BARE=(ht[1,1]/N)*nd var=((nd/N)^2)*ht[2,1] Cve=100*sqrt(var)/BARE Total[,1]=c(BARE, var, Cve) return(Total) } Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 19. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Broad Area Ratio Estimator Podsumowanie Literatura Przykład Estymacja liczby osób, które odbyły praktykę zgodnie z regulaminem na Wydziale Gospodarki Międzynarodowej z wykorzystaniem wiedzy na temat całej populacji. BARE.SI(N=308, n=62, nd=58, dane_los$q1_tak) y Estimation 53.322581 Variance 3.265668 CVE 3.389026 Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 20. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Podsumowanie Literatura Zastosowanie Statystyka Małych Obszarów wykorzystywana jest w sytuacjach, w których tradycyjne metody okazują się niewydolne i nieekonomiczne, kiedy istnieje zapotrzebowanie na informację na niskim poziemie agregacji przestrzennej, przy ograniczonym budżecie. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 21. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Podsumowanie Literatura Podsumowanie W prezentacji został przedstawiony zarys SMO oraz randomizacyjne podejście do estymacji. Oprócz niego w SMO wyróżnia się także: podejście modelowe, podejście bayesowskie. O czym innym razem... ¨ Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 22. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Podsumowanie Literatura Australian Bureau of Statistics, 2006, A Guide to Small Area Estimation, Australia. Paradysz J., 2009, Kryteria dobroci estymacji dla małych obszarów, Poznań. Rao J.N.K., 2003, Small Area Estimation, John Wiley & Sons, New York. Żądło T., 2008, Elementy statystyki małych obszarów z programem R, Wydawnictwo Akademii Ekonomicznej im. Karola Adamieckiego, Katowice. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych
  • 23. Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Podsumowanie Literatura Dziękuje za uwagę. Łukasz Wawrowski l.wawrowski@stat.gov.pl Statystyka Małych Obszarów w badaniach próbkowych