• Gefällt mir
Analiza e thjeshte e regresionit
Nächste SlideShare
Wird geladen in ...5
×

Analiza e thjeshte e regresionit

  • 4,184 Views
Hochgeladen am

 

  • Full Name Full Name Comment goes here.
    Sind Sie sicher, dass Sie...
    Ihre Nachricht erscheint hier
    Hinterlassen Sie den ersten Kommentar
    Be the first to like this
Keine Downloads

Views

Gesamtviews
4,184
Bei Slideshare
0
Aus Einbettungen
0
Anzahl an Einbettungen
0

Aktionen

Geteilt
Downloads
88
Kommentare
0
Gefällt mir
0

Einbettungen 0

No embeds

Inhalte melden

Als unangemessen gemeldet Als unangemessen melden
Als unangemessen melden

Wählen Sie Ihren Grund, warum Sie diese Präsentation als unangemessen melden.

Löschen
    No notes for slide

Transcript

  • 1. Analiza Statistikore Ligjërata e 10 Regresioni linear i thjeshtë II Qëllimet e mësimitNë këtë ligjëratë ju do të mësoni: Si të përdorni analizën e regresioninit për të parashikuar vlerën e e variablës së varur bazuar në variablën e pavarur. Kuptimin e koefiecentëve të regresionit b0 dhe b1 Të konkludoni rreth koeficientit të pjerrësisë dhe koeficientit të korrelacionit Se si t’i lexoni dhe interpretoni rezultatet e nxjerra përmes Excel-it.
  • 2. Korrelacioni dhe Regresioni• Skater diagrami mund të përdoret për të përshkruar raportet në mes të dy variablave• Analiza e regresionit përdoret për të përshkruar raportet në mes të dy variablave• Analiza e korrelacionit përdoret për të matur fortësinë e lidhjeve në mes të dy variablave. – Korrelacioni ka të bëjë vetëm me fortësinë e lidhjeve në mes të dy variablave – Nuk tregon shkaqet e lidhjes në mes të variablave – Skater diagrami është mësuar në vitin e parë – Korrelacioni gjithashtu është mësuar në vitin e parë. Hyrje në analizën e regresionit • Analiza e regresionit përdoret për të : – Parashikuar vlerën e variablës së varur të bazuar në vlerën e së paku një variable të pavarur. – Shpjegon efektet e ndryshimit të variablës së pavarur në variablën e varur. Variabla e varur (Y) : variabla që dëshirojmë ta vlerësojmë ose ta shpjegojmë. Variabla e pavarur (X): variabla e përdorur për të shpjeguar variablën e varur.
  • 3. Modeli i regresionit të thjeshtë linear Vetëm një variabël e pavarur X Marëdhëniet në mes të X dhe Y përshkruhen përmes funksionit linear. Ndryshimet në Y supozohet se shkaktohen nga ndryshimet në X Llojet e raporteve Raporte lineare Raporte jolineareY Y X XY Y X X
  • 4. Llojet e raporteve (vazhdim Lidhje të forta Lidhje të dobëtaY Y X XY Y X X Llojet e raporteve (vazhdim) Nuk ka lidhje fare Y X Y X
  • 5. Modeli i regresionit të thjeshtë linear ( në populacion) Koeficienti i Ndërprerja në Variabla e Gabimi i pjerrësisë së boshtin Y, në pavarur rastësishëm populacionitVariabla e populacionvarur Yi  β0  β1Xi  εi Komponenta lineare Komponenta e gabimit të rastësishëm Modeli i regresioni të thjeshtë linear (vazhdim) Y Yi  β0  β1Xi  εi Vlerat e vrojtuara të Y për Xi εi Pjerrësia = β1 Vlerat e projektuara të Y Gabimi i për Xi rastësishëm për këtë vlerë të XiNdërprerja = β0 Xi X
  • 6. Ekuacioni i Regresionit të thjesht linear (Vija e parashikuar-vlerësuar) Ekuacioni i regresionit të thjeshtë linear siguron vlerësimin e vijës së regresionit të popullimit Vlera e vlerësuar (ose Vlerësimi i Vlerësimi i e parashikuar ) prerjes së pjerrësisë së e Y për regresionit regresionit vrojtimin i Vlera e X për ˆ Yi  b0  b1Xi vrojtimin i Gabimi i rastësishëm individual ei ka mesatare zero Metoda e katrorëve më të vegjël • b0 dhe b1 sigurohen përmes së gjetjeve të vlerave b0 dhe b1 që minimizojnë shumën e devijimeve të ˆ ngritura në katrorë në mes të Y dhe Ymin (Yi Yi )2  min (Yi  (b0  b1Xi ))2 ˆ
  • 7. Gjetja e parametrave përmes ekuacionit të katrorëve më të vegjël. • Koeficientët b0 dhe b1 , dhe rezultatet e tjera të regresionit në këtë ligjëratë do të gjinden përmes përdorimit të Excel-it Formulat janë të prezantuara në ligjeratën e regresionit në vitin e parë të studimeve dhe mund të gjinden edhe në libër të Statistikës (Viti i Parë). Interpretimi i pjerrësisë dhe ndërprerjes(……ˆYi  b0  b1Xi • b0 është vlera mesatare e vlerësuar e Y kur vlera e X është zero • b1 është ndryshimi mesatar i vlerësuar i vlerës së Y si rezultat i ndryshimit të një njësie të X-it ( është koeficienti i pjerrësisë së vijës së regresionit, mund të jetë pozitiv dhe negativ)
  • 8. Shembull i regresionit të thjeshtë linear• Një kompani që merret me shitjen e patundshmërive dëshiron të vlerësojë raportet në mes të çmimit të shitjes së shtëpive dhe madhësisë së tyre ( të shprehura në meter katror)• Një mostër e rastësishme prej 10 shtëpive është marrë: – Variabla e varur (Y) = Çmimi i shtëpive në $1000 – Variabla e pavarur (X) = madhësia e shtëpive ( shprehur në meter katror - m 2 ) Të dhënat e mostrës për modelin e çmimeve të shtëpive Çmimi i shtëpive në Sipërfaqja ne m2 $1000 (X) (Y) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 1700
  • 9. Prezantimi grafik-• Modeli i çmimeve të shtëpive : diagrami shpërndarësRegresioni - Përdorimi i Excel-it • Data/ Data Analysis / Regression
  • 10. Rezultati i Excel-it Regression StatisticsMultiple R 0.76211 Ekuacioni i regresionit është:R Square 0.58082Adjusted R Square 0.52842 Çmimi i shtepive  98.24833  0.10977 (meter katror)Standard Error 41.33032Observations 10 ˆ Yi  b0  b1XiANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept b0 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror b1 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Prezantimi grafik • Modeli i çmimit të shtëpive: diagrami shpërndarës dhe vija e regresionit Pjerrësia = 0.10977 Prerja = 98.248 Çmimi i shtepive  98.24833  0.10977 (meter katror)
  • 11. Interpretimi i prerjes, koeficientit b0Çmimi i shtepive  98.24833  0.10977 (meter katror) • b0 është vlera mesatare e vlerësuar e Y kur X është zero (Nëse X = 0 është në vargun e vlerave të vrojtuara të X ) – Këtu nuk ka shtëpi me 0 meter katror, kështu që b0 = 98.24833 ,tregon se shtëpitë në vargun e vrojtuar të madhësive, $98,248.33 është pjesa e çmimit të shtëpive që nuk mund të spjegohen me sipërfaqen në meter katror. Interpretimi i koeficientit të pjerrësisë, b1Çmimi i shtepive  98.24833  0.10977 (meter katror) • b1 mat ndryshimin e vlerësuar në mesatare të Y si rezultat i ndryshimit të një njësie të X – Këtu b1 = 0.10977 na tregon se në mesatare çmimi i shtëpive rritet për 0.10977($1000) = $109.77, për çdo meter shtesë të madhësisë së shtëpisë.
  • 12. Parashikimi përmes analizës së regresionit Parashikoni çmimin e shtëpisë me 2000 metra katror. Çmimi i shtepive  98.25  0.1098 (m2 )  98.25  0.1098(2000)  317.85Çmimi i parashikuar për shtëpinë me 2000m2 është 317.85 ($1,000) = $317,850 Interpolimi kundrejt ekstrapolimit• Kur përdoret modeli i regresionit për parashikim, parashikoni vetëm në kuadër të vargut të vlerave të vrojtuara Vargu relevant per interpolim Mos provoni të parashikoni përtej vargut të vlerave të vrojtuara të X
  • 13. Masat e variacionit • Variacioni total përbëhet nga dy pjesë: SST  SSR  SSE Shuma totale e Shuma e katrorëve Shuma e katrorëve të katroreve të regresionit gabimitSST   ( Yi  Y)2 SSR   ( Yi  Y)2 ˆ SSE   ( Yi  Yi )2 ˆ Ku: Y = Vlera mesatare e variablës së varur Yi = Vlerat e vrojtuara të variablës së varur ˆ Yi = Vlera e parashikuar e Y për vlerën e dhënë të Xi Masat e variacionit (vazhdim) • SST = Shuma totale e katrorëve – Masë e variacioneve të vlerës së Yi rreth vlerës mesatare të tyre • SSR = Shuma e katrorëve të regresionit – Variacionet e spjegueshme të lidhura me raportet në mes të X dhe Y • SSE = Shuma e katrorëve të gabimit • Variacionet e lidhura më shumë me faktorë të tjerë se sa me raportet në mes të X dhe Y (Variacionet e pashpjegueshme)
  • 14. Masat e variacionit (vazhdim) YYi   SSE = (Yi - Yi )2 Y _ SST = (Yi - Y)2Y  __ SSR = (Yi - Y)2 _Y Y Xi X Koefiecienti i determinacionit, r2 • Koeficienti i determinacionit është pjesa e variacioneve totale në variablën e varur e cila spjegohet me variacionet në variablën e pavarur • Koeficienti i determinacionit gjithashtu quhet r në katror dhe shënohet si r2 SSR Shuma e katrorevete regresionit r2   SST Shuma totale e katroreve Vereni : 0  r2  1
  • 15. Rezultati i Excel-it SSR 18934.9348 Regression Statistics r2    0.58082Multiple R 0.76211 SST 32600.5000R Square 0.58082Adjusted R Square 0.52842 58.08% e variacioneve nëStandard Error 41.33032 çmimin e shtëpive spjegohetObservations 10 përmes variacioneve në sipërafqen me meter katror.ANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Gabimi standard i vlerësimit (Devijimi standard i vlerësimit) • Devijimi standard i variacioneve të vrojtimeve rreth vijës së regresionit vlerësohet përmes formulës vijuese: n SSE  (Y  Y ) ˆ i i 2 S YX   i1 n2 n2 Ku: SSE = shuma e katrorëve të gabimit të rastësishëm n = madhësia e mostrës
  • 16. Rezultati i Excel-it Regression StatisticsMultiple R 0.76211 SYX  41.33032R Square 0.58082Adjusted R Square 0.52842Standard Error 41.33032Observations 10ANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Konkluzioni rreth koeficientit të pjerrësisë së popullimit• Gabimi standard i koeficientit të pjerrësisë (b1) vlerësohet me formulën vijuese S YX S YX Sb1   SSX  (X  X) i 2 ku: Sb1 = Vlerësimi i gabimit standard të koeficientit të pjerrësisë SSE = Gabimi standard i vlerësimit S YX  n2
  • 17. Rezultati i Excel-it Regression StatisticsMultiple R 0.76211R Square 0.58082Adjusted R Square 0.52842Standard ErrorObservations 41.33032 10 Sb1  0.03297ANOVA df SS MS F Significance FRegression 1 18934.9348 18934.9348 11.0848 0.01039Residual 8 13665.5652 1708.1957Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Konkluzioni rreth pjerrësisë: Testi t • Testi t për pjerrësinë e populacionit – A ekziston lidhje lineare në mes të X dhe Y në populacion me nivel të signifikancës α= 0,05? • Hipoteza zero dhe alternative H0: β1 = 0 (Nuk ka lidhje lineare) H1: β1  0 (Lidhja lineare egziston) • Testi statistikor b β ku: t 1 1 b1 = koeficienti i pjerrësisë së Sb1 regresionit β1 = Pjerrësia e supozuar Sb1= Gabimi standard i sh.l.  n  2 pjerrësisë
  • 18. Konkluzioni rreth pjerrësisë: Testi t (vazhdim)Çmimi i Ekuacioni I regresionit të thjeshtë linear: Siperfaqjashtëpive (meter katror) $1000 (y) (x) Çmimi i shtepive  98.25  0.1098 (meter katror) 245 1400 312 1600 279 1700 Pjerrësia e këtij modeli është 308 1875 0.1098 199 1100 219 1550 A thua sipërfaqja në meter katror 405 2350 ka ndikim në çmimin e shitjes? 324 2450 319 1425 255 1700 Konkluzioni rreth pjerrësisë: Testi t- Shembull b1 Sb1H0: β1 = 0 Nga rezultatet e Excel-it:H1: β1  0 Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Meter katror 0.10977 0.03297 3.32938 0.01039 b1  β1 0.10977  0 t  t  3.32938 Sb1 0.03297
  • 19. Konkluzioni rreth pjerrësisë: Testi t- Shembull (vazhdim Testi statistikor t = 3.329 b1 Sb1 t H0: β1 = 0 Nga rezultati i Excel-it: H1: β1  0 Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Meter katror 0.10977 0.03297 3.32938 0.01039sh.l. = 10-2 = 8 Vendimi: a/2=.025 a/2=.025 Refuzo H0 Konkluzion: Ka mjaft të dhëna se sipërfaqja Refuzo H0 Mos e prano H0 Refuzo H0 -tα/2 tα/2 në meter katror ka ndikim në 0 -2.3060 2.3060 3.329 çmimin e shitjes së shtëpive. Konkluzioni rreth pjerrësisë: Testi t- Shembull (vazhdim) Vlera e P = 0.01039 Vlera e P- H0: β1 = 0 Nga rezultati i Excel-it: H1: β1  0 Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Square Feet 0.10977 0.03297 3.32938 0.01039Testi është dyanësor, Vendimi: Vlera e P < α kështu qëkështu që vlera e p është: : Refuzo H0P(t > 3.329)+P(t < -3.329)= 0.01039 Konkluzion:(per 8 sh.l.) Ka mjaft të dhëna se sipërfaqja në meter katror ka ndikim në çmimin e shitjes së shtëpive.
  • 20. Intervali i besimit për vlerësimin e koeficientit të Pjerrësisë Intervali I besimit për vlerësimin e pjerrësisë: b1  t n2Sb1 sh.l. = n - 2Rezultatet e Excel-it për çmimin e shtëpive: Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Ne nivel te besueshmerise 95%, intervali i besueshmerisë për pjerrësinë është: (0.0337, 0.1858) Intervali i besimit për vlerësimin e Pjerrësisë (vazhdim) Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Meqenëse vlera e shitjeve se shtëpive është e shprehur në $1000, ne jemi 95% konfident se efekti mesatar në cmimin e shitjes është në mes të $33.70 dhe $185.80 për meter katror të shtuar për një njësi.
  • 21. Testi t për Koeficientin e Korrelacionit • Hipotezat: H0: ρ = 0 (Nuk ka korrelacion në mes të X dhe Y) HA: ρ ≠ 0 (Ka korrelacion në mes të X dhe Y) • Testi Statistikor (me n – 2 shkallë të lirisë) r-ρt ku 1 r2 r   r 2 nese b1  0 n2 r   r 2 nese b1  0ρ  korrelacioni ne populacion Shembull: Çmimet e shtëpive A ka evidencë për raporte lineare në mes të sipërfaqes së shtëpive dhe Çmimit të shitjes së tyre në nivel të signifikancës 0.05? H0: ρ = 0 (Nuk ka korrelacion) H1: ρ ≠ 0 (Korrelacioni ekziston) a =0.05 , sh.l. = 10 - 2 = 8 r ρ 0.762  0 t   3.329 1 r2 1  0.7622 n2 10  2
  • 22. Shembull: Zgjedhja përmes testit r ρ .762  0 Vendimi:t   3.329 1 r 2 1 .7622 Refuzo H0 n2 10  2 Konkluzion: Ka evidencë seSh.l. = 10-2 = 8 ekziston lidhje lineare në a/2=0.025 a/2=0.025 nivelin 5% të signifikancës. Refuzo H0 Mos e refuzo H0 Refuzo H0 -tα/2 tα/2 0 -2.3060 2.3060 3.329 Përfundime Hyrje në analizën e regresionit Rishikim i supozimeve të analizës së regresionit Ekuacioni i regresionit të thjeshtë linear Përshkrimi i masave të variacionit Prurja e konkluzioneve rreth pjerrësisë së koeficientit të regresionit Analizimi i korrelacionit-matja e fortësisë së lidhjeve, etj