Analiza e thjeshte e regresionit
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Analiza e thjeshte e regresionit

am

  • 4,980 Views

 

Statistiken

Views

Gesamtviews
4,980
Views auf SlideShare
4,980
Views einbetten
0

Actions

Gefällt mir
0
Downloads
85
Kommentare
0

0 Einbettungen 0

No embeds

Zugänglichkeit

Kategorien

Details hochladen

Uploaded via as Adobe PDF

Benutzerrechte

CC Attribution-NonCommercial LicenseCC Attribution-NonCommercial License

Report content

Als unangemessen gemeldet Als unangemessen melden
Als unangemessen melden

Wählen Sie Ihren Grund, warum Sie diese Präsentation als unangemessen melden.

Löschen
  • Full Name Full Name Comment goes here.
    Sind Sie sicher, dass Sie...
    Ihre Nachricht erscheint hier
    Processing...
Kommentar posten
Kommentar bearbeiten

Analiza e thjeshte e regresionit Document Transcript

  • 1. Analiza Statistikore Ligjërata e 10 Regresioni linear i thjeshtë II Qëllimet e mësimitNë këtë ligjëratë ju do të mësoni: Si të përdorni analizën e regresioninit për të parashikuar vlerën e e variablës së varur bazuar në variablën e pavarur. Kuptimin e koefiecentëve të regresionit b0 dhe b1 Të konkludoni rreth koeficientit të pjerrësisë dhe koeficientit të korrelacionit Se si t’i lexoni dhe interpretoni rezultatet e nxjerra përmes Excel-it.
  • 2. Korrelacioni dhe Regresioni• Skater diagrami mund të përdoret për të përshkruar raportet në mes të dy variablave• Analiza e regresionit përdoret për të përshkruar raportet në mes të dy variablave• Analiza e korrelacionit përdoret për të matur fortësinë e lidhjeve në mes të dy variablave. – Korrelacioni ka të bëjë vetëm me fortësinë e lidhjeve në mes të dy variablave – Nuk tregon shkaqet e lidhjes në mes të variablave – Skater diagrami është mësuar në vitin e parë – Korrelacioni gjithashtu është mësuar në vitin e parë. Hyrje në analizën e regresionit • Analiza e regresionit përdoret për të : – Parashikuar vlerën e variablës së varur të bazuar në vlerën e së paku një variable të pavarur. – Shpjegon efektet e ndryshimit të variablës së pavarur në variablën e varur. Variabla e varur (Y) : variabla që dëshirojmë ta vlerësojmë ose ta shpjegojmë. Variabla e pavarur (X): variabla e përdorur për të shpjeguar variablën e varur.
  • 3. Modeli i regresionit të thjeshtë linear Vetëm një variabël e pavarur X Marëdhëniet në mes të X dhe Y përshkruhen përmes funksionit linear. Ndryshimet në Y supozohet se shkaktohen nga ndryshimet në X Llojet e raporteve Raporte lineare Raporte jolineareY Y X XY Y X X
  • 4. Llojet e raporteve (vazhdim Lidhje të forta Lidhje të dobëtaY Y X XY Y X X Llojet e raporteve (vazhdim) Nuk ka lidhje fare Y X Y X
  • 5. Modeli i regresionit të thjeshtë linear ( në populacion) Koeficienti i Ndërprerja në Variabla e Gabimi i pjerrësisë së boshtin Y, në pavarur rastësishëm populacionitVariabla e populacionvarur Yi  β0  β1Xi  εi Komponenta lineare Komponenta e gabimit të rastësishëm Modeli i regresioni të thjeshtë linear (vazhdim) Y Yi  β0  β1Xi  εi Vlerat e vrojtuara të Y për Xi εi Pjerrësia = β1 Vlerat e projektuara të Y Gabimi i për Xi rastësishëm për këtë vlerë të XiNdërprerja = β0 Xi X
  • 6. Ekuacioni i Regresionit të thjesht linear (Vija e parashikuar-vlerësuar) Ekuacioni i regresionit të thjeshtë linear siguron vlerësimin e vijës së regresionit të popullimit Vlera e vlerësuar (ose Vlerësimi i Vlerësimi i e parashikuar ) prerjes së pjerrësisë së e Y për regresionit regresionit vrojtimin i Vlera e X për ˆ Yi  b0  b1Xi vrojtimin i Gabimi i rastësishëm individual ei ka mesatare zero Metoda e katrorëve më të vegjël • b0 dhe b1 sigurohen përmes së gjetjeve të vlerave b0 dhe b1 që minimizojnë shumën e devijimeve të ˆ ngritura në katrorë në mes të Y dhe Ymin (Yi Yi )2  min (Yi  (b0  b1Xi ))2 ˆ
  • 7. Gjetja e parametrave përmes ekuacionit të katrorëve më të vegjël. • Koeficientët b0 dhe b1 , dhe rezultatet e tjera të regresionit në këtë ligjëratë do të gjinden përmes përdorimit të Excel-it Formulat janë të prezantuara në ligjeratën e regresionit në vitin e parë të studimeve dhe mund të gjinden edhe në libër të Statistikës (Viti i Parë). Interpretimi i pjerrësisë dhe ndërprerjes(……ˆYi  b0  b1Xi • b0 është vlera mesatare e vlerësuar e Y kur vlera e X është zero • b1 është ndryshimi mesatar i vlerësuar i vlerës së Y si rezultat i ndryshimit të një njësie të X-it ( është koeficienti i pjerrësisë së vijës së regresionit, mund të jetë pozitiv dhe negativ)
  • 8. Shembull i regresionit të thjeshtë linear• Një kompani që merret me shitjen e patundshmërive dëshiron të vlerësojë raportet në mes të çmimit të shitjes së shtëpive dhe madhësisë së tyre ( të shprehura në meter katror)• Një mostër e rastësishme prej 10 shtëpive është marrë: – Variabla e varur (Y) = Çmimi i shtëpive në $1000 – Variabla e pavarur (X) = madhësia e shtëpive ( shprehur në meter katror - m 2 ) Të dhënat e mostrës për modelin e çmimeve të shtëpive Çmimi i shtëpive në Sipërfaqja ne m2 $1000 (X) (Y) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 1700
  • 9. Prezantimi grafik-• Modeli i çmimeve të shtëpive : diagrami shpërndarësRegresioni - Përdorimi i Excel-it • Data/ Data Analysis / Regression
  • 10. Rezultati i Excel-it Regression StatisticsMultiple R 0.76211 Ekuacioni i regresionit është:R Square 0.58082Adjusted R Square 0.52842 Çmimi i shtepive  98.24833  0.10977 (meter katror)Standard Error 41.33032Observations 10 ˆ Yi  b0  b1XiANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept b0 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror b1 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Prezantimi grafik • Modeli i çmimit të shtëpive: diagrami shpërndarës dhe vija e regresionit Pjerrësia = 0.10977 Prerja = 98.248 Çmimi i shtepive  98.24833  0.10977 (meter katror)
  • 11. Interpretimi i prerjes, koeficientit b0Çmimi i shtepive  98.24833  0.10977 (meter katror) • b0 është vlera mesatare e vlerësuar e Y kur X është zero (Nëse X = 0 është në vargun e vlerave të vrojtuara të X ) – Këtu nuk ka shtëpi me 0 meter katror, kështu që b0 = 98.24833 ,tregon se shtëpitë në vargun e vrojtuar të madhësive, $98,248.33 është pjesa e çmimit të shtëpive që nuk mund të spjegohen me sipërfaqen në meter katror. Interpretimi i koeficientit të pjerrësisë, b1Çmimi i shtepive  98.24833  0.10977 (meter katror) • b1 mat ndryshimin e vlerësuar në mesatare të Y si rezultat i ndryshimit të një njësie të X – Këtu b1 = 0.10977 na tregon se në mesatare çmimi i shtëpive rritet për 0.10977($1000) = $109.77, për çdo meter shtesë të madhësisë së shtëpisë.
  • 12. Parashikimi përmes analizës së regresionit Parashikoni çmimin e shtëpisë me 2000 metra katror. Çmimi i shtepive  98.25  0.1098 (m2 )  98.25  0.1098(2000)  317.85Çmimi i parashikuar për shtëpinë me 2000m2 është 317.85 ($1,000) = $317,850 Interpolimi kundrejt ekstrapolimit• Kur përdoret modeli i regresionit për parashikim, parashikoni vetëm në kuadër të vargut të vlerave të vrojtuara Vargu relevant per interpolim Mos provoni të parashikoni përtej vargut të vlerave të vrojtuara të X
  • 13. Masat e variacionit • Variacioni total përbëhet nga dy pjesë: SST  SSR  SSE Shuma totale e Shuma e katrorëve Shuma e katrorëve të katroreve të regresionit gabimitSST   ( Yi  Y)2 SSR   ( Yi  Y)2 ˆ SSE   ( Yi  Yi )2 ˆ Ku: Y = Vlera mesatare e variablës së varur Yi = Vlerat e vrojtuara të variablës së varur ˆ Yi = Vlera e parashikuar e Y për vlerën e dhënë të Xi Masat e variacionit (vazhdim) • SST = Shuma totale e katrorëve – Masë e variacioneve të vlerës së Yi rreth vlerës mesatare të tyre • SSR = Shuma e katrorëve të regresionit – Variacionet e spjegueshme të lidhura me raportet në mes të X dhe Y • SSE = Shuma e katrorëve të gabimit • Variacionet e lidhura më shumë me faktorë të tjerë se sa me raportet në mes të X dhe Y (Variacionet e pashpjegueshme)
  • 14. Masat e variacionit (vazhdim) YYi   SSE = (Yi - Yi )2 Y _ SST = (Yi - Y)2Y  __ SSR = (Yi - Y)2 _Y Y Xi X Koefiecienti i determinacionit, r2 • Koeficienti i determinacionit është pjesa e variacioneve totale në variablën e varur e cila spjegohet me variacionet në variablën e pavarur • Koeficienti i determinacionit gjithashtu quhet r në katror dhe shënohet si r2 SSR Shuma e katrorevete regresionit r2   SST Shuma totale e katroreve Vereni : 0  r2  1
  • 15. Rezultati i Excel-it SSR 18934.9348 Regression Statistics r2    0.58082Multiple R 0.76211 SST 32600.5000R Square 0.58082Adjusted R Square 0.52842 58.08% e variacioneve nëStandard Error 41.33032 çmimin e shtëpive spjegohetObservations 10 përmes variacioneve në sipërafqen me meter katror.ANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Gabimi standard i vlerësimit (Devijimi standard i vlerësimit) • Devijimi standard i variacioneve të vrojtimeve rreth vijës së regresionit vlerësohet përmes formulës vijuese: n SSE  (Y  Y ) ˆ i i 2 S YX   i1 n2 n2 Ku: SSE = shuma e katrorëve të gabimit të rastësishëm n = madhësia e mostrës
  • 16. Rezultati i Excel-it Regression StatisticsMultiple R 0.76211 SYX  41.33032R Square 0.58082Adjusted R Square 0.52842Standard Error 41.33032Observations 10ANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Konkluzioni rreth koeficientit të pjerrësisë së popullimit• Gabimi standard i koeficientit të pjerrësisë (b1) vlerësohet me formulën vijuese S YX S YX Sb1   SSX  (X  X) i 2 ku: Sb1 = Vlerësimi i gabimit standard të koeficientit të pjerrësisë SSE = Gabimi standard i vlerësimit S YX  n2
  • 17. Rezultati i Excel-it Regression StatisticsMultiple R 0.76211R Square 0.58082Adjusted R Square 0.52842Standard ErrorObservations 41.33032 10 Sb1  0.03297ANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Konkluzioni rreth pjerrësisë: Testi t • Testi t për pjerrësinë e populacionit – A ekziston lidhje lineare në mes të X dhe Y në populacion me nivel të signifikancës α= 0,05? • Hipoteza zero dhe alternative H0: β1 = 0 (Nuk ka lidhje lineare) H1: β1  0 (Lidhja lineare egziston) • Testi statistikor b β ku: t 1 1 b1 = koeficienti i pjerrësisë së Sb1 regresionit β1 = Pjerrësia e supozuar Sb1= Gabimi standard i sh.l.  n  2 pjerrësisë
  • 18. Konkluzioni rreth pjerrësisë: Testi t (vazhdim)Çmimi i Ekuacioni I regresionit të thjeshtë linear: Siperfaqjashtëpive (meter katror) $1000 (y) (x) Çmimi i shtepive  98.25  0.1098 (meter katror) 245 1400 312 1600 279 1700 Pjerrësia e këtij modeli është 308 1875 0.1098 199 1100 219 1550 A thua sipërfaqja në meter katror 405 2350 ka ndikim në çmimin e shitjes? 324 2450 319 1425 255 1700 Konkluzioni rreth pjerrësisë: Testi t- Shembull b1 Sb1H0: β1 = 0 Nga rezultatet e Excel-it:H1: β1  0 Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Meter katror 0.10977 0.03297 3.32938 0.01039 b1  β1 0.10977  0 t  t  3.32938 Sb1 0.03297
  • 19. Konkluzioni rreth pjerrësisë: Testi t- Shembull (vazhdim Testi statistikor t = 3.329 b1 Sb1 t H0: β1 = 0 Nga rezultati i Excel-it: H1: β1  0 Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Meter katror 0.10977 0.03297 3.32938 0.01039sh.l. = 10-2 = 8 Vendimi: a/2=.025 a/2=.025 Refuzo H0 Konkluzion: Ka mjaft të dhëna se sipërfaqja Refuzo H0 Mos e prano H0 Refuzo H0 -tα/2 tα/2 në meter katror ka ndikim në 0 -2.3060 2.3060 3.329 çmimin e shitjes së shtëpive. Konkluzioni rreth pjerrësisë: Testi t- Shembull (vazhdim) Vlera e P = 0.01039 Vlera e P- H0: β1 = 0 Nga rezultati i Excel-it: H1: β1  0 Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Square Feet 0.10977 0.03297 3.32938 0.01039Testi është dyanësor, Vendimi: Vlera e P < α kështu qëkështu që vlera e p është: : Refuzo H0P(t > 3.329)+P(t < -3.329)= 0.01039 Konkluzion:(per 8 sh.l.) Ka mjaft të dhëna se sipërfaqja në meter katror ka ndikim në çmimin e shitjes së shtëpive.
  • 20. Intervali i besimit për vlerësimin e koeficientit të Pjerrësisë Intervali I besimit për vlerësimin e pjerrësisë: b1  t n2Sb1 sh.l. = n - 2Rezultatet e Excel-it për çmimin e shtëpive: Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Ne nivel te besueshmerise 95%, intervali i besueshmerisë për pjerrësinë është: (0.0337, 0.1858) Intervali i besimit për vlerësimin e Pjerrësisë (vazhdim) Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Meqenëse vlera e shitjeve se shtëpive është e shprehur në $1000, ne jemi 95% konfident se efekti mesatar në cmimin e shitjes është në mes të $33.70 dhe $185.80 për meter katror të shtuar për një njësi.
  • 21. Testi t për Koeficientin e Korrelacionit • Hipotezat: H0: ρ = 0 (Nuk ka korrelacion në mes të X dhe Y) HA: ρ ≠ 0 (Ka korrelacion në mes të X dhe Y) • Testi Statistikor (me n – 2 shkallë të lirisë) r-ρt ku 1 r2 r   r 2 nese b1  0 n2 r   r 2 nese b1  0ρ  korrelacioni ne populacion Shembull: Çmimet e shtëpive A ka evidencë për raporte lineare në mes të sipërfaqes së shtëpive dhe Çmimit të shitjes së tyre në nivel të signifikancës 0.05? H0: ρ = 0 (Nuk ka korrelacion) H1: ρ ≠ 0 (Korrelacioni ekziston) a =0.05 , sh.l. = 10 - 2 = 8 r ρ 0.762  0 t   3.329 1 r2 1  0.7622 n2 10  2
  • 22. Shembull: Zgjedhja përmes testit r ρ .762  0 Vendimi:t   3.329 1 r 2 1 .7622 Refuzo H0 n2 10  2 Konkluzion: Ka evidencë seSh.l. = 10-2 = 8 ekziston lidhje lineare në a/2=0.025 a/2=0.025 nivelin 5% të signifikancës. Refuzo H0 Mos e refuzo H0 Refuzo H0 -tα/2 tα/2 0 -2.3060 2.3060 3.329 Përfundime Hyrje në analizën e regresionit Rishikim i supozimeve të analizës së regresionit Ekuacioni i regresionit të thjeshtë linear Përshkrimi i masave të variacionit Prurja e konkluzioneve rreth pjerrësisë së koeficientit të regresionit Analizimi i korrelacionit-matja e fortësisë së lidhjeve, etj