Modul ini membahas regresi dan korelasi sederhana serta berganda, chi-square, dan statistik nonparametrik. Topik utama meliputi pengertian dan metode regresi, korelasi, uji hipotesis koefisien regresi, interval taksiran, serta contoh soalnya.
2. Alya Fauziyah Taufik Nur Rachman Deasy Puspasari
Karina Indri M. S. Rudolf P. Purba Yessica Sardina Purba
Ahmad Hamdi Farhatunisa Siti Hudaepah
Lois Jessica Karina Megasari Anita Kesia Zonebia
Nina Arina Yana Mulyana Fauzi Catra Evan Ramadhani
3. DAFTAR ISI
REGRESI DAN KORELASI SEDERHANA………………………………………………..79
REGRESI DAN KORELASI BERGANDA………………………………………………..101
CHI-SQUARE………………………………………………………………………………154
NON PARAMETRIK ……………………………………………………………………...168
NON PARAMETRIK 1…………………………………………………………………….171
NON PARAMETRIK 2……………………………………………………………………198
4. 79
REGRESI DAN KORELASI SEDERHANA
Untuk mempelajari hubungan-hubungan antar variabel dalam suatu persamaan dapat
mengunakan regresi dan korelasi dalam menganalisisnya. Regresi sederhana menunjukan
hubungan linear (garis lurus) antar dua variabel dan memperkirakan nilai dari variabel terikat
Y berdasarkan nilai dari variabel bebas X. Sedangkan korelasi sederhana mempelajari
hubungan antara variabel-variabel atau dengan kata lain menunjukan apakah dua variabel
mempunyai hubungan atau tidak.
A. REGRESI SEDERHANA
1. Pengertian Regresi
Persamaan Regresi adalah sebuah persamaan yang menunjukan hubungan linear
antara dua variabel. (Lind, Teknik-teknik Statistik dalam Ekonomi dan Bisnis :74)
Bentuk Umum
Keterangan :
Ŷ = Variabel Terikat (Variabel yang diperkirakan)
X = Variabel Bebas (Variabel yang mempengaruhi variabel terikat)
a = nilai Y dimana diperkirakan garis regresinya memotong sumbu Y ketika X bernilai
nol (intercept)
b = kemiringan garis, atau perubahan rata-rata Y setiap perubahan satu unit X (slope)
2. Metode Pengukuran Regresi Sederhana
a. Least Square Method
Bentuk Umum = Ŷ = a + bX
Ŷ = a + bX
5. 80
Rum
us :
ΣY = an + bΣX atau a = ( )
ΣXY = aΣX + bΣX2
atau
(∑ ) (∑ )(∑ )
( )
b. Product Moment Method
Bentuk Umum : Ŷ = a + bX
Rumus :
Σxy = b ΣX+ bΣX2
atau b= ,dimana
Σxy = ΣXY – Σx2
= ΣX2
–
( )
Σy2 =
ΣY2
–
( )
∑ ∑
B. Korelasi
Analisis korelasi adalah sekumpulan teknik untuk mengukur hubungan antar dua
variabel. (Lind, Teknik-teknik Statistika dalam Bisnis dan Ekonomi: 61)
1. Koefisien korelasi (r)
Koefisien korelasi menunjukan kekuatan hubungan antara dua himpunan variabel.
Diberi tanda r, dan nilai r dapat berkisar dari -1 sampai +1. Tanda negatif berarti varibel
berkorelasi negatif, tanda positif berarti variabel berkorelasi positif, serta apabila tidak
terdapat hubungan sama sekali antar variabel maka r bernilai 0.
Kekuatan dari koefisien korelasi menurut Iqbal Hasan:
0.00 < r ≤ 0.20 = sangat lemah
0.21 < r ≤ 0.40 = lemah
0.41 < r ≤ 0.60 = cukup
6. 81
0.61 < r ≤ 0.80 = kuat
0.81 < r ≤ 1.00 = sangat kuat
Rumus Pearson :
√( ( ) )( ( ) )
Rumus Product Moment :
r =
√( )
2. Koefisien Determinasi
Koefisien determinasi adalah perbandingan total variasi dalam variabel terikat Y yang
dapat dijelaskan oleh variasi dalam variabel bebas X. (Lind)
Dirumuskan
r2
x 100%
- Koefisien non determinasi adalah perbandingan total variasi terikat Y yang dapat
dijelaskan oleh variabel diluar model.
Dirumuskan
1 - r2
3. Kesalahan Standard Estimasi ( Standard Error of Estimate )
Adalah suatu ukuran yang menunjukan seberapa tepat prediksi untuk Y berdasarkan X atau
sebaliknya, seberapa tidak akuratnya estimasi itu. Dirumuskan
Least Square Method Product Moment Method
SYX =√ SYX = √
Keterangan :
n = banyaknya pasangan variabel independen x dan variabel dependen y
7. 82
k = banyaknya macam variabel independen x
4. Penaksiran tentang interval α dan interval β
Menaksir interval α
(n > 30)
a – Z1/2α.Sa < konstanta α < a + Z1/2α.Sa
(n ≤ 30)
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
Sa = SYX . √
Menaksir interval β
(n > 30)
b – Z1/2α.Sb < konstanta β < b + Z1/2α.Sb
(n ≤ 30)
b – t1/2α.Sb < konstanta β < b + t1/2α.Sb
Sb = SYX . √
5. Pengujian tentang Koefisien Regresi
Menguji α
- Tentukan Ho dan Ha
Ho : Konstanta α = 0 (tidak berpengaruh
signifikan)
Ha : Konstanta α ≠ 0 (ada pengaruh
signifikan)
- Tentukan t1/2α dengan df = n-k-1
n = jumlah sampel
k = jumlah variabel x
Tentukan thitung dengan :
t =
- Tentukan daerah penolakan yaitu
thitung < -t1/2α atau thitung > t1/2α Ho ditolak
t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat ditolak
Menguji β
- Tentukan Ho dan Ha
Ho : β = (tidak berpengaruh
signifikan)
Ha : β ≠ (ada pengaruh signifikan)
- Tentukan t1/2α dengan df = n-k-1
- Tentukan thitung dengan
t =
- Tentukan daerah penolakan yaitu
thitung < -t1/2α atau thitung > t1/2α Ho
ditolak
t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat
ditolak
Daerah penerimaan
Ho
-t1/2α t1/2α
Daerah penolakan Ho
(daerah kritis)
Daerah penolakan Ho
(daerah kritis )
?
8. 83
- Kesimpulan
6. Interval Taksiran
Interval taksiran untuk rata-rata taksiran µYX
Ŷo – t1/2α SŶ< µYX < Ŷo + t1/2α SŶ
SŶ = SYX √ ( x )
Interval taksiran untuk Y individu
Ŷo – t1/2α SŶ< Y< Ŷo + t1/2α SŶ
SŶ = SYX √ ( x )
7. Pengujian Korelasi populasi
Menguji apakah sampel berasal dari populasi
yang berkorelasi
Ho : ρ = 0 (tidak berasal dari populasi yang
berkorelasi)
Ha : ρ ≠ 0 (berasal dari populasi yang
berkorelasi)
df = n-k-1
t =
(√
√
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
8. Batas-batas koefisien korelasi populasi ρ
- jika berkorelasi tidak perlu dihitung, jika berkorelasi perlu dihitung
( )
( )
Z1/2α. Sr <
( )
( )
<
( )
( )
Z1/2α.Sr
Sr =
√
9. 84
CONTOH SOAL
Manager Investasi di Astra International, memiliki data mengenai penghasilan karyawan di
perusahaan tersebut dan persentase investasi kembali para karyawan pada produk keuangan
yang dikeluarkan perusahaan.
Karyawan Penghasilan (juta) Investasi Kembali (%)
Ade 7,0 20,2
Ahmad 7,8 20,4
Anjar 8,2 30,6
Andi 9,1 28,5
Adi 8,7 25,4
Anji 11,3 30,5
Adi 11,7 32,8
Ari 10,0 42,0
Apri 12,8 29,0
Ati 12,2 29,3
Tentukanlah :
a. Persamaan regresi dan interpretasi
b. Koefisien korelasi, determinasi, non determinasi serta artinya
c. Standard Error of estimate.
Jawaban
Penghasilan
(X)
Investasi Kembali
(Y)
(XY) X² Y²
7,0 20,2 141,4 49 408,04
7,8 20,4 159,12 60,84 416,16
8,2 30,6 250,92 67,24 936,36
10. 85
9,1 28,5 259,35 82,81 812,25
8,7 25,4 220,98 75,69 645,16
11,3 30,5 344,65 127,69 930,25
11,7 32,8 383,76 136,89 1075,84
10,0 42,0 420 100 1764
12,8 29,0 371,2 163,84 841
12,2 29,3 357,46 148,84 858,49
X = 98.8 Y = 288.7 ΣXY = 2908,76 ΣX² = 1012,84 ΣY²= 8687,55
a. Persamaan Regresi
a = ( )
=
( ) ( )
( ) ( )
= 13.6838565511
Dan
(∑ ) (∑ )(∑ )
(∑ ) (∑ )
=
( ) ( )
( ) ( )
= 1.53706126008
Maka persamaan regresinya adalah : Y= 13.6838565511 + 1.53706126008X Dari persamaan
tersebut dapat diketahui bahwa rata-rata persentase investasi kembali tanpa dipengaruhi oleh
variabel apapun adalah sebesar 13.6838565511 Sedangkan jika dipengaruhi oleh penghasilan,
jika pendapatan naik sebesar 1 juta rupiah rata-rata jumlah investasi kembali akan bertambah
adalah sebanyak 1.53706126008 unit.ceteris paribus
b. r =
√( ( ) )( ( ) )
r =
( ) ( )
√( ( ) ( )( ( ) ( ))
r = 0.49573313338
Artinya, korelasi antara jumlah pengasilan dengan investasi kembali adalah cukup kuat dan
searah.
Koefisien determinasi adalah :
R2
X 100% = 0.495733133382
X 100% = 24.575133953 %
11. 86
Artinya, variasi jumlah penghasilan menjelaskan total variasi Persentase investasi kembali
sebesar 24.575133953 % dan sisanya dijelaskan oleh variabel lain diluar model.
Koefisien non determinasi
1 – R2
= 1 - 0.495733133382
= 0.24575133953 x 100 % = 75.424866047
c. SYX =√
= √
( ) ( ) ( )
= 5.69799
Jadi, rata-rata penyimpangan variabel persentasi investasi kembali prediksi terhadap variabel
variabel persentase investasi kembali adalah sebesar 5.69799.
12. 87
SOAL REGRESI DAN KORELASI SEDERHANA
1. Berikut ini adalah data berat mobil dalam ribuan pon dan konsumsi bahan bakar dalam
mil/gallon.
Berat mobil 2.0 2.4 2.8 3.4 3.6 3.2 2.6 2.9 2.5 2.7
Konsumsi
bahan bakar
32 30 28 23 19 25 27 24 29 33
a. Buat persamaan regresi dan interpretasinya!
b. Hitung standard error of estimate!
c. Hitung koefisien korelasi dan determinasi, jelaskan!
d. Pada tingkat signifikansi 5%, dapatkah disimpulkan bahwa terhadap hubungan negatif
antara dua variabel tersebut?
e. Batas-bats taksiran koefisien regresi α pada tingkat kepercayaan 95%!
Jawab :
Berat Mobil (X)
Konsumsi Bahan
Bakar (Y)
XY X2
Y2
2.0 32 64 4 1024
2.4 30 72 5.76 900
2.8 28 78.4 7.84 784
3.4 23 78.2 11.56 529
3.6 19 68.4 12.96 361
3.2 25 80 10.24 625
2.6 27 70.2 6.76 729
2.9 24 69.6 8.41 576
2.5 29 72.5 6.25 841
2.7 33 89.1 7.29 1089
ΣX=28.1 ΣY=270 ΣXY=742.4 ΣX2
=81.04 ΣY2
=7458
a. Persamaan Regresi
a = ( )
( )( ) ( )( )
( ) ( )
13. 88
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa rata-rata konsumsi bahan bakar tanpa
dipengaruhi oleh variabel apapun adalah sebesar %. Sedangkan jika
dipengaruhi oleh berat mobil , jika berat mobil naik sebesar 1 ribu pon, maka rata-rata
konsumsi bahan bakar akan turun sebesar mil/gallon, ceteris paribus.
b.SYX = √ √
( ) ( )( )
Jadi, rata-rata penyimpangan variabel konsumsi bahan bakar bakar prediksi terhadap
variabel konsumsi bahan bakar sebenarnya adalah sebesar
c.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( ))
Artinya, koefisien korelasi dari berat mobil dan bahan bakar minyak adalah sebesar
. Artinya korelasi antara kedua variabel adalah negatif dan sangat kuat.
Koefisien determinasi adalah
R2
X 100% = ( )2
X 100 % = 0.76069653449 x 100 = 76.069653449 %
Artinya variabel berat mobil mampu menjelaskan variabel konsumsi bahan bakar
sebanyak 76.069653449 % dan sisanya 23.930346551% dijelaskan oleh faktor lain di luar
model.
d. Ho : ρ = 0 (tidak ada korelasi)
Ha : ρ ≠ 0 (ada korelasi )
df = 10-1-1 = 8
t 1/2α = 2,3060
t =
(√
√
√
√
t =
14. 89
kriteria :
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
Ternyata < -2,306 atau > 2.306 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi negatif antara berat mobil dan
konsumsi bahan bakar.
e. Sa = SYX . √ → Σx2
= ΣX2
–
( )
= –
( )
= 2.079
Sa = . √
Sa = 0.708899 df = 10-1-1=8
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
–2.3060*0.708899 < Konstanta α < +
2.3060*0.708899
47.396545 < Konstanta α < 50.665988
Jadi pada tingkat signifikansi 5%, batas-batas taksiran kostanta α berada dalam regresi
populasi -47.396545 hingga 50.665988.
2. Norton Corp. Ingin mengetahui hubungan antara bonus yang diterima dengan jumlah
lembur karyawan tersebut. Kemudian Norton Corp. Mewawancarai 20 karyawannya dan
mendapatkan :
ΣX=75 ; ΣY=250 ; ΣXY=1500; ΣX2
=700 ; ΣY2
=5000. Dari informasi tersebut, tentukan :
a. Tentukan persamaan regresinya dan interpretasi!
b. r dan r2
serta berikan interpretasinya!
c. Pada tingkat signifikansi 5%, ujilah bahwa jumlah lembur dapat mempengaruhi jumlah
bonus yang diterima oleh karyawan Norton Corp.!
Jawab :
a. a = ( )
( )( ) ( )( )
( ) ( )
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
15. 90
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa jumlah bonus tanpa dipengaruhi oleh
variabel apapun adalah sebesar satuan. Sedangkan jika dipengaruhi oleh
lembur, jika jumlah lembur naik sebesar 1 satuan, maka rata-rata jumlah bonus akan naik
sebesar satuan, ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( ))
0.6348111
Artinya, koefisien korelasi dari jumlah bonus dan jumlah lembur adalah sebesar
0.6348111. Artinya korelasi antara kedua variabel adalah positif dan kuat.
r2
= (0.6348111)2
= 0.4029851 x 100% = 40.29851 %
k2
+ r2
= 100%
k 2
= 100% - 40.29851 %= 59.70149%
Artinya variabel berat mobil mampu menjelaskan variabel konsumsi bahan bakar
sebanyak 40.29851 % dan sisanya 59.70149% dijelaskan oleh faktor lain di luar model.
c. Ho : ρ = 0 (tidak ada korelasi)
Ha : ρ ≠ 0 (ada korelasi )
df = 20-1-1 = 18
t 1/2α = 2.1009
t =
(√
√
√
√
= 3.4856851
kriteria :
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
Ternyata < -2.1009 atau 3.4856851 > 2.1009 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi positif antara jumlah bonus dan
jumlah lembur karyawan.
3. Based on the theory of supply, it can be presumed that there is a relationship between
production and price. below is the data production and palm oil prices from 1995 to 2004.
16. 91
Year
Production
(million of ton)
Price
(US $/ton)
1995 4.54 271
1996 4.53 319
1997 5.03 411
1998 6.05 348
1999 6.09 287
2000 6.14 330
2001 6.37 383
2002 7.40 384
2003 7.22 472
2004 7.81 610
2005 8.49 640
2006 8.81 652
Determine :
a. The regression equation and give the interpretation!
b. How much r and r2
and give the interpretation!
c. The standard error of estimation and interpretation!
d. With significance 5%, estimate interval constanta α!
e. With significance 5%, estimate interval constanta β and test constanta β can influence
the regression model significantly!
f. At significance 5%, can we conclude that the sample comes from population which
have correlation?
Answer :
Production (Y) Price (X) X2
Y2
XY
4.54 271 73441 20.61 1230.34
4.53 319 101761 20.52 1445.07
5.03 411 168921 25.30 2067.33
6.05 348 121104 36.60 2105.40
6.09 287 82369 37.09 1747.83
6.14 330 108900 37.70 2026.20
6.37 383 146689 40.58 2439.71
7.40 384 147456 54.76 2841.60
7.22 472 222784 52.13 3407.84
7.81 610 372100 61.00 4764.10
8.49 640 409600 72.08 5433.60
8.81 652 425104 77.62 5744.12
ΣY=78.48 ΣX=5107 Σ X2
=2380229 Σ Y2
=535.98 Σ XY=35253.14
a. Regression equation
a = ( )
( )( ) ( )( )
( ) ( )
17. 92
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
0.008963
So, the regression equation is Y = + X. It means that average
production if not influenced by anything variabel is about millions of ton. And
if influenced by price, in one US $/ton increasing in price then average production will be
increasing about 0.008963 US $/ton, ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( ))
0.8550648
So, the correlation between production and price is 0.8550648. On the other hand, the
corelation is very strong and positive, because the value close to +1.
r2
= (0.8550648)2
= 0.7311359 x 100% = 73.11359 %
k2
+ r2
= 100%
k 2
= 100% - 73.11359 %= 0.99268864%
so, the variation of production can explain total variation of price about 73.11359 % and
the residual about 0.99268864% is explained by variable out of model.
c. SYX = √ √
( ) ( )( )
So the standard error of estimate is . It means that varians of production
prediction can explain real production about 16.28992761.
d. Sa = SYX . √ → Σx2
= ΣX2
–
( )
= –
( )
= 206774.9167
Sa = . √
Sa = 2.19560320235 df = 12-1-1=10
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
–2.2281*2.19560320235 < Konstanta α < + 2.2281*2.19560320235
-2.28275 < Konstanta α < 7.733593
So, with significance 5% the limits of estimated α are constant in the population
regression -2.28275 to 7.733593.
e. (n ≤ 30)
b – t1/2α.Sb < konstanta β< b + t1/2α.Sb
18. 93
Sb = SYX . √
Σx2
= ΣX2
–
( )
Σx2
= –
( )
= 206774.9167
Maka Sb = . √
Sb = 0.00492982807 df = 12-1-1=10
b – t1/2α.Sb < konstanta β< b + t1/2α.Sb
–2.2281*0.00492982807 < Konstanta α < + 2.2281*0.00492982807
2.71443785 < Konstanta β < 2.73640615
With significance 5%, interval estimation constanta β for regression of population is
between 2.71443785 to 2.73640615
Uji t
Ho: β = 0 (tidak ada pengaruh signifikan)
Ha: β ≠ 0 (Ada pengaruh signifikan)
α= 0,05 df = 10
t α/2 = 2.2281
t =
t =
t = 552.8432151
criteria
-thitung <-t1/2α atau thitung > t1/2α → Ho ditolak
evidently -552.8432151 < - 2.2281 or 552.8432151 > 2.2281 → Ho rejected
so, with significance 5%, the test shows that constanta β ≠ 0. It means that constanta β
influence significantly.
d. Ho : ρ = 0 (no correlation)
Ha : ρ ≠ 0 (correlation)
df = 12-1-1 = 10
t 1/2α = 2.2281
19. 94
t =
(√
√
√
√
t = 5.214740
criteria :
Ho rejected if
-thitung < -t1/2α or thitung > t1/2α
-5.214740 < -2.2281 or 5.214740 > 2.2281 then Ho is rejected
So, at significance 5%, there are positif correlation between production and price.
4. The data below is the income and consumption data per day from Nabila.
Income
(tens of thousands of dollars)
Consumption
(tens of thousands of dollars)
40 25
55 40
60 50
75 55
87 65
95 73
120 90
Determine :
a. What is the regression equation and give the interpretation?
b. How much the coeficient corelation for the case and interpretation?
c. How much the size of house can explain the selling price and interpretation?
d. Determine the standard error of estimate and interpretation?
Answer :
Income
(X)
Consumption
(Y)
X2
Y2
XY
40 25 100 121 140
55 40 121 169 143
60 50 110.25 144 126
75 55 144 121 132
87 65 64 169 104
95 73 110.25 100 105
120 90 81 144 108
ΣX=532 ΣY=398 Σ X2
=44.844 Σ Y2
=25.404 Σ XY=33.715
20. 95
a. Regression equation
a = ( )
( )( ) ( )( )
( ) ( )
0.000318
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
0.73545
So, the regression equation is Y = 0.000318+ 0.73545X. It means that average
consumption if not influenced by anything variabel is about 0.000318 tens of thousands of
dollars. And if influenced by income, in tens of thousands of dollars increasing in price
then average consumption will be increasing about 0.73545 tens of thousands of dollars,
ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( ))
-1.0000013
So, the correlation between consumption and income is -1.0000013. On the other hand, the
corelation is very strong and negative.
c. r2
= (-1.0000013)2
= 1.00000 x 100% = 100 %
k2
+ r2
= 100%
k 2
= 100% - 100 %= 0%
so, the variation of consumption can explain total variation of price about 100 % and the
residual about 0% is explained by variable out of model.
d. SYX = √ √
( ) ( )( )
So the standard error of estimate is . It means that varians of production
prediction can explain real production about .
5. The following table is the observation of the random sample of 8 villages in cities
"alphabet" of income and health expenditure villagers during 2012.
Village
Income
(millions of rupiah)
Health expenditure
(millions of rupiah)
A 21 4
B 15 3
C 15 3.5
D 9 2
E 12 3
F 18 3.5
G 6 2.5
H 12 2.5
21. 96
a. What is the regression equation and give the interpretation?
b. Determine the value of the coefficient of correlation, coefficient of determination,
coefficient of non-determination and give the explanation!
Answer :
Village Income (X)
Health
expenditure (Y)
X2
Y2
XY
A 21 4 441 16 84
B 15 3 225 9 45
C 15 3.5 225 12.25 52.5
D 9 2 81 4 18
E 12 3 144 9 36
F 18 3.5 324 12.25 63
G 6 2.5 36 6.25 15
H 12 2.5 144 6.25 30
ΣX=108 ΣY=24 Σ X2
=1620 Σ Y2
=75 Σ XY=343.5
a. Regression equation
a = ( )
( )( ) ( )( )
( ) ( )
0.735443361
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
0.735443
So, the regression equation is Y = 0.735443361+ 0.735443X. It means that average health
expenditure if not influenced by anything variabel is about 0.735443361 millions of
rupiah. And if influenced by income, in one millions of rupiah increasing in income then
average health expenditure will be increasing about 0.735443 millions of rupiah, ceteris
paribus.
b. Coefficient of correlation
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( ))
0.884538
So, the correlation between consumption and income is 0.884538. On the other hand, the
corelation is very strong and positive.
Coefficient of determination
r2
= (0.884538)2
= 0.7824074 x 100% = 78.24074 %
k2
+ r2
= 100%
Coefficient of non determination
k 2
= 100% - 78.24074 %= 21.75926 %
so, the variation of income can explain total variation of health expenditure about
78.24074 % and the residual about 21.75926 % is explained by variable out of model.
22. 97
6. Tabel berikut menunjukkan hasil pengamatan terhadap sampel acak yang terdiri dari 15
usaha kecil di suatu kecamatan mengenai omzet penjualan dan laba (dalam juta rupiah).
Omzet Penjualan Laba
34 32
38 36
34 31
40 38
30 29
40 35
40 33
34 30
35 32
39 36
33 31
32 31
42 36
40 37
42 35
a. Tentukan persamaan regresinya dan interpretasi!
b. r dan r2
serta berikan interpretasinya!
c. Pada tingkat signifikansi 5%, ujilah bahwa omzet penjualan dapat mempengaruhi laba!
Jawab :
Omzet
Penjualan (X)
Laba
(Y)
X2
Y2
XY
34 32 1156 1024 1088
38 36 1444 1296 1368
34 31 1156 961 1054
40 38 1600 1444 1520
30 29 900 841 870
40 35 1600 1225 1400
40 33 1600 1089 1320
34 30 1156 900 1020
35 32 1225 1024 1120
39 36 1521 1296 1404
33 31 1089 961 1023
32 31 1024 961 992
42 36 1764 1296 1512
40 37 1600 1369 1480
42 35 1764 1225 1470
ΣX=553 ΣY=502 Σ X2
=20599 Σ Y2
=16912 Σ XY=18641
a. a = ( )
( )( ) ( )( )
( ) ( )
115.7944
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
0.632557
23. 98
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa laba tanpa dipengaruhi oleh variabel
apapun adalah sebesar 115.7944 juta rupiah. Sedangkan jika dipengaruhi oleh omzet
penjualan, jika jumlah omzet penjualan naik sebesar 1 juta rupiah, maka rata-rata laba
akan naik sebesar juta rupiah, ceteris paribus.
b.
√( ( ) )( ( ) )
( ) ( )
√( ( ) ( )( ( ) ( ))
0.8707684
Artinya, koefisien korelasi dari laba dan omzet penjualan adalah sebesar 0.6348111.
Artinya korelasi antara kedua variabel adalah positif dan kuat.
r2
= (0.8707684)2
= 0.7582377 x 100% = 75.82377 %
k2
+ r2
= 100%
k 2
= 100% - 75.82377 %= 24.17623 %
Artinya variabel omzet penjualan mampu menjelaskan variabel laba sebanyak 75.82377 %
dan sisanya 24.17623 % dijelaskan oleh faktor lain di luar model.
c. Ho : ρ = 0 (tidak ada korelasi)
Ha : ρ ≠ 0 (ada korelasi )
df = 15-1-1 = 13
t 1/2α = 2.1604
t =
(√
√
√
√
t = 6.38528
kriteria :
Ho ditolak jika
-thitung < -t1/2α atau thitung > t1/2α
Ternyata -6.38528 < -2.1604 atau 6.38528 > 2.1604 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi positif antara laba dan omzet
penjualan.
24. 99
7. Dibawah ini adalah biaya promosi dan volume penjualan dari PT.Cahaya Kamila.
Biaya Promosi
(Rupiah)
Volume Penjualan
(Buah)
12 56
13.50 62.43
12.75 60.85
12.60 61.30
14.85 65.83
15.20 66.35
15.75 65.26
16.80 68.80
18.45 70.47
17.90 65.20
Tentukan :
a. Persamaan regresi dan interpretasi!
b. Hitunglah standard error estimasinya!
c. Taksirlah berapa volume penjualan, apabila biaya promosi yang dikeluarkan adalah Rp
19?
Jawab :
Biaya Promosi
(X)
Volume
Penjualan
(Y)
X2
Y2
XY
12 56 144 3136 672
13.50 62.43 182.25 3897.5 842.805
12.75 60.85 162.563 3702.72 775.838
12.60 61.30 158.76 3757.69 772.38
14.85 65.83 220.523 4333.59 977.576
15.20 66.35 231.04 4402.32 1008.52
15.75 65.26 248.063 4258.87 1027.85
16.80 68.80 282.24 4733.44 1155.84
18.45 70.47 340.403 4966.02 1300.17
17.90 65.20 320.41 4251.04 1167.08
ΣX=149.8 ΣY=642.49 Σ X2
=2290.25 Σ Y2
=41439.2 Σ XY=9700.05
25. 100
a. a = ( )
( )( ) ( )( )
( ) ( )
39.77692
(∑ ) (∑ )(∑ )
( )
( ) ( )( )
( ) ( )
1.63365
maka persamaan regresinya adalah Y = X.
Dari persamaan tersebut dapat diketahui bahwa volume penjualan tanpa dipengaruhi oleh
variabel apapun adalah sebesar rupiah. Sedangkan jika dipengaruhi oleh biaya
promosi, jika biaya promosi naik sebesar 1 rupiah, maka rata-rata vome penjualan akan
naik sebesar 1.63365 satuan, ceteris paribus.
b. SYX =√ = √
( )( ) ( )( )
= 62.9775912527
Jadi, rata-rata penyimpangan variabel volume penjualan prediksi terhadap variabel volume
penjualan sebenarnya adalah 62.9775912527.
c. Y = X
Y = (15)
Y = 64.28167
Jadi, ketika biaya promosi yang dikeluarkan adalah Rp 19 maka volume penjualan adalah
sebesar 64.28167.
26. 101
REGRESI DAN KORELASI BERGANDA
A. REGRESI LINEAR BERGANDA
1. Hubungan Linear Lebih dari Dua Variabel
Disamping hubungan linear antar dua variabel, hubungan linear lebih dari dua
variabel juga sering terjadi. Misalnya, hubungan antara hasil penjualan dengan harga
dan daya beli, hubungan antara rata-rata harga beras dengan dengan jumlah
penduduk, pendapatan, dan jumlah uang beredar, atau hubungan antara produksi
padi dengan bibit, pupuk, luas sawah, dan curah hujan. (Ir. M. Iqbal Hasan, M.M.,
Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua).Friedman (1962)
menyatakan bahwa keputusan seseorang untuk mengonsumsi sesuatupada dasarnya
tidak hanya dipengaruhi oleh faktor pendapatannya, tetapi juga perkiraan
pendapatannya pada masa akan dating, selain faktor suku bunga, pajak, distribusi
pendapatan, dan lainnya.
Hubungan linear lebih dari dua variabel bila dibuat dalam persamaan
matematis sebagai berikut:
= a + b1X1 + b2X2+ ... +bkXk
Keterangan:
Y = variabel dependen
X1, X2, ..., Xk = variabel independen
a = bilangan konstan (konstanta)
b1, b2, ..., bk = koefisien variabel
Pada persamaan linear lebih dari dua variabel, variabel Y dipengaruhi oleh
lebih dari dua variabel, yaitu X1, X2,...., Xk. Dimana variabel Y disebut dengan
variabel terikat atau dependent variable / explained variable / predictand /
regressand / response / endogeneous / outcome / controlled variable, dan variabel-
variabel X1, X2,...., Xk disebut dengan variabel bebas atau independent variable /
explanatory variable / predictor / regressor / stimulus / exogenous / covariate /
control variable.(Damodar N. Gujarati, Basic Econometrics).
27. 102
2. Persamaan Regresi Linear Berganda
Regresi Linear berganda adalah regresi dimana variabel terikatnya (Y) di
dijelaskan oleh lebih dari satu variabel bebas (X1, X2,...., Xk) namun masih
menunjukkan diagram hubungan yang linear.(Ir. M. Iqbal Hasan, M.M., Pokok-
Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua)
Bentuk umum persamaan regresi linear berganda :
a. Bentuk Stokastik
̂= a + b1X1 + b2X2+ ... +bkXk + e
b. Bentuk Nonstokastik (Deterministik)
̂= a + b1X1 + b2X2+ ... +bkXk
Keterangan:
̂ = variabel terikat / dependen (nilai duga Y)
X1, X2, ..., Xk = variabel bebas / independen
a = bilangan konstan (konstanta)
b1, b2, ..., bk = koefisien regresi (parameter)
e = nilai residual / error / pengganggu (Y-̂)
3. Persamaan Regresi Linear Berganda dengan Dua Variabel Bebas
Bentuk umum persamaan regresi linear berganda dengan dua variabel bebas
adalah sebagai berikut:
= a + b1X1 + b2X2
Keterangan:
Y = variabel terikat / dependen (nilai duga Y)
X1, X2 = variabel bebas / independen
b1,b2 =koefisien regresi linear berganda disebut juga sebagai koefisien
regresi parsial (partial coefficient regression)
a = konstanta (nilai Y, apabila X1 = X2 = 0)
b1 = besarnya kenaikan/penurunan Y dalam satuan,
jika X1naiksatu satuan dan X2 konstan
b2 = besarnya kenaikan/penurunan Y dalam satuan,
jika X2naik satu satuan dan X1 konstan
+ atau - = tanda yang menunjukkan arah hubungan antara Y dan X1atau X2
28. 103
Nilai dari koefisien a, b1, b2 dapat ditentukan salah satunya dengan metode
kuadrat terkecil atau Ordinary Least Square Method.
Metode Kuadrat Terkecil
Metode Kuadrat terkecil atau Ordinary Least Square Method pada prinsipnya
adalah meminimumkan jumlah kuadrat deviasi di sekitar garis regresi. Dan nilai
koefisien regresi a, b1, dan b2 dapat dipecahkan secara simultan dari tiga persamaan
berikut :
∑Y = na + b1∑X1 + b2∑X2
∑X1Y = a∑X1 + b1∑X1
2
+ b2∑X1∑X2
∑X2Y = a∑X2 + b1∑X1∑X2 + b2∑X2
2
Untuk mendapatkan koefisien regresi a, b1, dan b2 dengan menggunakan persamaan
di atas, diperlukan perhitungan yang cukup panjang, oleh karena itu, dikembangkan
beberapa cara yang lebih mudah, sebagai berikut :
A = n∑X1Y – ∑X1∑Y
B = n∑X2
2
– (∑X2)2
C = n∑X1X2 - ∑X1∑X2
D = n∑X2Y - ∑X2∑Y
E = n∑X1
2
– (∑X1)2
F = EB – C2
Dari beberapa persamaan tersebut, nilai koefisien regresi untuk a, b1, dan b2dapat
diperoleh dengan cara berikut :
∑ ∑ ∑
29. 104
B. PENGUJIAN KOEFISIEN REGRESI
1. Standard Error of Estimate / KesalahanBaku dalam Penaksiran (SE)
Kesalahan baku dalam penaksiran melihat seberapa jauh nilai penduga, yaitu b1
dan b2 dari nilai sebenarnya, yaitu B1 dan B2 (parameter populasi). Oleh karena
nilai ini menunjukkan besarnya penyimpangan atau error, maka semakin kecil
nilainya dianggap akan lebih baik. Untuk menghitung kesalahan baku ini dapat
digunakan rumus berikut :
√
∑
∑ ∑ (∑ )
∑
∑ ∑ (∑ )
df = n – k – 1 = n – 3
∑
∑ ∑( )
2. Pendugaan Hipotesis Koefisien Regresi Berganda (Parameter 𝛃1 dan 𝛃1)
a. Pengujian Hipotesis Simultan (F statistik)
Digunakan untuk melihat signifikansi variabel independent
( )secara keseluruhan / bersama–sama dalam mempengaruhi nilai
variabel dependen (Y).Langkah-langkah pengujiannya adalah sebagai berikut :
i. Menentukan formulasi hipotesis
(X1 dan X2 secara bersama-sama tidak
mempengaruhi Y)
(X1 dan X2 secara bersama-sama mempengaruhi Y atau
paling sedikit ada satu X yang mempengaruhi Y)
ii. Menentukan Taraf nyata (α) dan nilai F
Taraf nyata (α) dan nilai F tabel ditentukan dengan derajat kebebasan v1 = k -
1 dan v2 = n – k.
30. 105
iii. Menentukan nilai F stat
SST = ΣY2
– n Y 2
SSR = b1 ΣX1Y + b2 ΣX2Y
SSE = SST – SSR
iv. Menentukan Kriteria Pengujian
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
atau
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
v. Membuat Kesimpulan
Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
b. Pengujian Hipotesis Individual / Parsial (t statistik)
Digunakan untuk melihat signifikansi variabel independent ( )
secara parsial dalam mempengaruhi variabel dependen (Y).Langkah-langkah
pengujiannya adalah sebagai berikut :
i. Menentukan formulasi hipotesis
Ho : 𝛃i = 0 ( tidak ada pengaruh Xi secara parsial terhadap Y)
Ha : 𝛃i > 0 ( ada pengaruh positif Xi secara parsial terhadap Y)
𝛃i < 0 ( ada pengaruh negatif Xi secara parsial terhadap Y)
𝛃i ≠ 0 ( ada pengaruh Xi secara parsial terhadap Y)
ii. Menentukan Taraf nyata (α) dan nilai t tabel
Taraf nyata dari t tabel ditentukan dengan derajat kebebasan :
df = n – k – 1, (k = banyaknya jumlah variabel X)
iii. Menentukan nilai t stat
iv. MenentukanKriteria Pengujian
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
3,2,
i
Sb
Bb
t
i
ii
stat
1df
SSR
MSR
2df
SSE
MSE
31. 106
tstat> ttabel→ Ho ditolak
atau
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
v. Membuat Kesimpulan
Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
C. KORELASI LINEAR BERGANDA
Korelasi linear berganda merupakan alat ukur mengenai hubungan yang
terjadi antara variabel terikat (variabel Y) dan dua atau lebih variabel bebas (X1, X2,
..., Xk). Analisis korelasinya menggunakan tiga koefisien korelasi, yaitu koefisien
determinasi berganda, koefisien korelasi berganda dan koefisien korelasi parsial.(Ir.
M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi
kedua )
a. Koefisien Determinasi Berganda (R2
)
Koefisien Determinasi Berganda, dilambangkan dengan R2
, merupakan ukuran
kesesuaian garis regresi linear berganda terhadap suatu data. Koefisien determinasi
tersebut digunakan untuk :
Mengukur besarnya kontribusi variasi X1 dan X2 (variable independen)
terhadap variasi Y dalam hubungnnya dengan persamaan garis regresi
linear berganda = a + b1X1 + b2X2.
Menentukkan apakah garis regresi linear berganda Y terhadap X1 dan X2
sudah cocok untuk dipakai sebagai pendekatan hubungan linear antar
variabel berdasarkan hasil observasi (goodness of fit).
Nilai koefisien determinasi berganda terletak antara 0 dan 1 (0 ≤ R2
≤ 1).
Koefisien determinasi berganda dirumuskan:
(Ir. M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi
kedua )
2
22112
y
yxbyxb
R
32. 107
b. Koefisien Korelasi Berganda (R)
Koefisien korelasi berganda, disimbolkan Ry.12, merupakan ukuran keeratan
hubungan antara variabel terikat dan semua variabel bebas secara bersama-sama.
c. Koefisien Korelasi Parsial (r)
Koefisien korelasi parsial merupakan koefisien korelasi antara dua variabel
jika variabel lainnya konstan, pada hubungan yang melibatkan lebih dari dua
variabel. Sebelum menghitung koefisien korelasi parsial, dilakukan terlebih dahulu
perhitungan koefisien korelasi sederhana, yaitu:
∑ ∑ ∑
√[ ∑ (∑ ) ][ ∑ (∑ ) ]
∑ ∑ ∑
√[ ∑ (∑ ) ][ ∑ (∑ ) ]
∑ ∑ ∑
√[ ∑ (∑ ) ][ ∑ (∑ ) ]
Koefisien Korelasi Parsial antara Y dan X1, apabila X2 konstan
√( )( )
Koefisien Korelasi Parsial antara Y dan X2, apabila X1 konstan
√( )( )
Koefisien Korelasi Parsial antara X1 dan X2, apabila Y konstan
√( )( )
(Suharyadi & Purwanto, Statistika, Untuk Ekonomi dan Keuangan Modern, Edisi 2)
2
2211
12.
y
yxbyxb
Ry
33. 108
Contoh soal:
Dibawah ini adalah data dari PDB, jumlah investasi, dan nilai ekspor negara YY dalam kurun
waktu 10 tahun terakhir:
PDB
(triliun rupiah)
Jumlah Investasi
(miliar rupiah)
Nilai Ekspor
(miliar rupiah)
190 20 40
340 45 65
350 30 70
400 57 80
300 40 50
450 62 80
370 50 70
180 22 35
280 60 40
300 34 60
Sumber: fiktif
a. Tentukan persamaan regresi dan interpretasikan!
b. Tentukan koefisien determinasi dan nondeterminasi! Interpretasikan nilainya!
c. Berapa besar penyimpangan variabel PDB yangdiprediksi terhadap variabel PDB
sebenarnya?
d. Tentukan koefisien korelasi berganda dan korelasi parsial antara variabel jumlah
investasi terhadap variabel PDB dengan menganggap variabel nilai ekspor konstan,
korelasi parsial antara variabel nilai ekspor terhadap variable PDB dengan
menganggap variabel jumlah investasi konstan, dan korelasi parsial antarvariabel
independen ! Bagaimana sifatnya?
e. Dengan tingat kepercayaan 95%, apakah jumlah investasi dan nilai ekspor
memengaruhi secara parsial terhadap PDB?
f. Apakah investasi dan nilai ekspor memengaruhi secara bersama-sama terhadap PDB?
(α=5%)
34. 109
Penyelesaian:
Langkah – langah dengan menggunakan softwareSPSS :
1. Buka SPSS, masukkan nama variabel pada variable view, dan masukkan data pada
data view
2. pada menu bar, pilih analyze, sub menu regression, lalu klik linear
3. masukkan variabel Y ke dalam kotak dependent dan X1 dan X2 ke dalam kotak
independent
4. Klik Statistics
Regression Coefficient → aktifkan estimates
Aktifkan model fit, descriptives, dan part and partial correlations
Klik Continue
5. Klik Option
Pilih Stepping Method Kriteria → entry 0.05
Aktifkan Include Constant in Equation
Pada box missing value pilih exclude cases pairwise
Klik Continue
Lalu klik OK
6. Outputnya adalah sebagai berikut :(Jawab)
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients
t Sig.
Correlations
B
Std.
Error
Beta
Zero-
order
Partial Part
1 (Constant) 8.942 20.079 0.445 0.669
X1 1.987 0.416 0.356 4.772 0.002 0.766 0.875 0.298
X2 3.79 0.38 0.744 9.971 0 0.94 0.967 0.622
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 8,942 + 1,987 X1 + 3,790 X2
Interpretasi :
a = 8,942
Tanpa dipengaruhi oleh variabel apapun, rata – rata PDB yang didapatkan negara YY
adalah sebesar 8,942 triliun rupiah.
35. 110
b1 = 1,987
Artinya, setiap kenaikan jumlah investasi sebesar 1 miliar rupiah, maka rata – rata PDB
akan naik sebesar 1,987 triliun rupiah dengan variabel nilai ekspor dianggap konstan.
b2 = 3,790
artinya setiap kenaikan nilai ekspor sebesar 1 miliar rupiah, maka rata – rata PDB akan
naik sebesar 3,790 triliun rupiah dengan variabel investasi dianggap konstan.
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .986a
.973 .965 16.00284
a. Predictors: (Constant), X2, X1
b. Koefisien determinasi : R2
= 0,973
Koefisien nondeterminasi : K2
= 1 - R2
= 1 – 0,973 = 0,027
Artinya,variabel jumlah investasidanvariabel nilai ekspor mampu menjelaskan variasi
dari PDB negara YY sebesar 97,3%, dan sisanya sebesar 2,7% dijelaskan oleh faktor
lain di luar model.
c. Standard Error of Estimate (SE)
SE = 16,00284
Artinya, rata-rata penyimpangan variabel PDB yang diprediksi dengan variabel PDB
sebenarnya adalah sebesar 16,00284 Triliun Rupiah
d. Koefisien korelasi berganda (R) = 0,986
Artinya, hubungan keseluruhan antara variabel PDB, variabeljumlah investasi, dan
variabel nilai eksporadalah searah dan sifatnya sangat erat yaitu sebesar 0,986.
36. 111
Correlations
Y X1 X2
Pearson
Correlation
Y 1.000 .766 .940
X1 .766 1.000 .550
X2 .940 .550 1.000
Sig. (1-tailed) Y . .005 .000
X1 .005 . .050
X2 .000 .050 .
N Y 10 10 10
X1 10 10 10
X2 10 10 10
ry1.2 = 0,766
Artinya hubungan antara variabel jumlah investasi secara parsial terhadap variabel
PDB adalahsearah dan sifatnya erat dengan nilai sebesar 0,766, dengan menganggap
variabel nilai ekspor konstan.
ry2.1 = 0,940
Artinya hubungan antara variabel nilai ekspor secara parsial terhadap variabel PDB
adalahsearah dan sifatnya sangat erat dengan nilai sebesar 0,940, dengan menganggap
variabel jumlah investasi konstan.
r12.y = 0,550
Artinya hubungan antara variabel jumlah investasi dan variabel nilai ekspor secara
parsial adalahsearah dan sifatnya cukup eratdengan nilai sebesar 0,550, dengan
menganggap variabel PDB konstan.
37. 112
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients
t Sig.
Correlations
B
Std.
Error
Beta
Zero-
order
Partial Part
1 (Constant) 8.942 20.079 0.445 0.669
X1 1.987 0.416 0.356 4.772 0.002 0.766 0.875 0.298
X2 3.79 0.38 0.744 9.971 0 0.94 0.967 0.622
a. Dependent Variable: Y
e. Uji t statistik :
1. Uji Parsial variabel PDB terhadap Variabel Jumlah Investasi
Hipotesis :
(variabel jumlah investasi secara parsial tidak berpengaruh
signifikan terhadap variabel PDB)
(variabel jumlah investasi secara parsial berpengaruh signifikan
terhadap variabel PDB)
Nilai t stat dan t tabel :
t stat = 4,772
t tabel = 2,3646
df = n – k – 1 = 10 – 2 – 1 = 7
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 4,772 ˃ 2,3646 makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,002 dan α = 0,05
Ternyata Sig. < α, yaitu 0,002< 0,05 maka ditolak
38. 113
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah investasi secara parsial
berpengaruh signifikan terhadap variabel PDB
2. Uji Parsial variabel PDB terhadap Variabel Jumlah Investasi
Hipotesis :
(variabel nilai ekspor secara parsial tidak berpengaruh signifikan
terhadap variabel PDB)
(variabel nilai ekspor secara parsial berpengaruh signifikan
terhadap variabel PDB)
Nilai t stat dan t tabel :
t stat = 9,971
t tabel = 2,3646
df = n – k – 1 = 10 – 2 – 1 = 7
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 9,971 > 2,3646 makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,000 dan α = 0,05
Ternyata Sig. < α, yaitu 0,000< 0,05 maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel nilai ekspor secara parsial berpengaruh
signifikan terhadap variabel PDB.
39. 114
f. Uji F statistik
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 64047.363 2 32023.681 125.048 .000a
Residual 1792.637 7 256.091
Total 65840.000 9
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hipotesis :
(variabel jumlah investasidan variabel nilai ekspor secara
bersama-samatidak berpengaruh signifikan terhadap
variabel PDB)
(variabel jumlah investasidan variabel nilai eksporsecara
bersama-sama berpengaruh signifikan terhadap variabel
PDB)
Nilai F stat dan F tabel :
F stat = 125,048 F tabel = 5,32 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 10 – 2 = 8
Kriteria uji :
i. Uji tabel F
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
Ternyata F stat > F tabel, yaitu 125,048 >5,32 maka Ho ditolak
ii. Uji Sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,000 dan α = 0,05
Ternyata Sig. < α, yaitu 0,000< 0,05, maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah investasidan variabel nilai
eksporsecara bersama-sama berpengaruh signifikan terhadap variabel PDB
40. 115
SOAL REGRESI DAN KORELASI BERGANDA
1. Konsumen yang loyal akan memberi peningkatan keuntungan. Banyak cara yang bisa
dilakukan untuk meningkatkan loyalitas konsumen. Untuk memuaskan konsumen,
ada pemikiran di kalangan pengusaha kuliner atau rumah makan di daerah Bandung
untuk meningkatkan keuntungan usaha, yaitu dengan menambah jumlah tenaga kerja
untuk meningkatkan kepuasan pelayanan atau memperluas area parkir sebagai usaha
memberikan pelayanan yang baik pada konsumen. Untuk itu, dilakukan survey
terhadap 15 pengusaha kulinerdi wilayah Bandung pada tahun 2012. Hasil survey
tersebut adalah sebagai berikut:
Nama Restoran
Pendapatan
(Juta Rupiah)
Jumlah Tenaga Kerja
(Orang)
Parkir Mobil
(Ruang)
Double Steak 280 14 18
Waroeng Steak 130 7 3
Steak Ranjang 123 13 8
Giggle Box 160 12 7
Hummingbird 450 39 36
Tokyo Connection 570 67 84
The Cost 315 20 5
Javan Steak 64 4 8
Kopi Progo 340 48 55
Hanamasa 670 81 98
Laksana 370 12 65
Nanny’s Pavillon 644 59 9
Bebek Garang 128 44 12
The Kiosk 415 28 9
Ampera 387 65 12
a. Tentukan persamaan regresinya dan interpretasikan !
b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial !
Interpretasikan !
c. Berapa besar penyimpangan variabel pendapatan pengusaha kuliner
yangdiprediksi terhadap variabel pendapatan yang sebenarnya?
41. 116
d. Lakukan pengujian secara parsial antar variabel pendapatan dan jumlah tenaga
kerja, juga variabel pendapatan dan parkir mobil, dengan tingkat signifikansi
5% !
e. Lakukan pengujian simultan antara variabel jumlah tenaga kerja dan variabel
parkir mobil terhadap variabel pendapatan !
f. Jika anda seorang pengusaha kuliner di Bandung, apakah anda harus
menambah tenaga kerja saja, area parkir saja, atau keduanya ?
Jawab :
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients
t Sig.
Correlations
B
Std.
Error
Beta
Zero-
order
Partial Part
1
(Constant)
123.911 54.379 2.279 0.042
X1 4.873 1.5789 0.634 3.087 0.009 0.785 0.665 0.519
X2 1.602 1.260 0.261 1.271 0.228 0.627 0.345 0.214
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 123,911 + 4,873 X1 + 1,602 X2
Interpretasi :
a = 123,911
Tanpa dipengaruhi oleh variabel apapun, rata – rata pendapatan yang didapatkan
pengusaha kuliner adalah sebesar Rp 123.911.000.
b1 = 4,873
Artinya, setiap kenaikan jumlah tenaga kerja sebanyak 1 orang, maka rata – rata
pendapatan pengusaha kuliner akan naik sebesar Rp 4.873.000 dengan variabel
lahan parkir mobil dianggap konstan.
b2 = 1,602
Artinya setiap kenaikan lahan parkir mobil sebanyak1 lahan, maka rata – rata
pendapatan akan naik sebesar Rp 1.602.000 dengan variabel jumlah tenaga kerja
dianggap konstan.
42. 117
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .813
a
.661 .605 121.55813
a. Predictors: (Constant), X2, X1
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .785 .627
X1 .785 1.000 .576
X2 .627 .576 1.000
Sig. (1-tailed)
Y . .000 .006
X1 .000 . .012
X2 .006 .012 .
N
Y 15 15 15
X1 15 15 15
X2 15 15 15
b.
Koefisien Determinasi : R2
= 0,605 (Adjusted R2
)
Koefisien Non Determinasi : K2
= 1 - R2
= 1 – 0,605 = 0,395
Artinya,variabel jumlah tenaga kerjadanvariabel lahan parkir mobil mampu
menjelaskan variasi dari pendapatan pengusaha kulinersebesar 60,5%, dan sisanya
sebesar 39,5% dijelaskan oleh faktor lain di luar model.
Koefisien Korelasi Berganda (R) = 0,813
Artinya, hubungan keseluruhan antara variabel pendapatan pengusaha kuliner,
variabeljumlah tenaga kerja, dan variabel lahan parkir adalah searah dan sifatnya
cukup erat yaitu sebesar 0,813 atau 81,3%.
Koefisien Korelasi Parsial (r)
ry1.2 = 0,785
Artinya hubungan antara variabel jumlah tenaga kerja secara parsial terhadap
variabel pendapatan pengusaha kulineradalah searah dan sifatnya eratdengan
nilai sebesar 0,785, dengan menganggap variabel lahan parkir mobil konstan.
43. 118
ry2.1 = 0,627
Artinya hubungan antara variabel lahan parkir mobil secara parsial terhadap
variabel pendapatan pengusaha kulineradalah searah dan
sifatnyacukuperatdengan nilai sebesar 0,627, dengan menganggap variabel
jumlah tenaga kerja konstan.
r12.y = 0,576
Artinya hubungan antara variabel jumlah tenaga kerja dan variabel lahan parkir
mobil secara parsial adalah searah dan sifatnya cukup eratdengan nilai sebesar
0,576, dengan menganggap variabel pendapatan pengusaha kuliner konstan.
c. Standard Error of Estimate (SE)
SE = 121,55813
Artinya, rata-rata penyimpangan variabel pendapatan pengusaha kuliner yang
diprediksi dengan variabel pendapatan pengusaha kuliner yang sebenarnya adalah
sebesar RP 121.558.130.
d. Uji t statistik :
1. Uji Parsial Variabel Pendapatan Pengusaha Kuliner Terhadap Variabel
Jumlah Tenaga Kerja
Hipotesis :
(variabel jumlah tenaga kerja secara parsial tidak berpengaruh
signifikan terhadap variabel pendapatan pengusaha kuliner)
(variabel jumlah tenaga kerja secara parsial berpengaruh
signifikan terhadap variabel pendapatan pengusaha kuliner)
Nilai t stat dan t tabel :
t stat = 3,087
t tabel = 2,1788
df = n – k – 1 = 15 – 2 – 1 = 12
α = 0,05
44. 119
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 3,087 ˃ 2,1788makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,009 dan α = 0,05
Ternyata Sig. < α, yaitu 0,009< 0,05 maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah tenaga kerja secara parsial
berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner.
2. Uji Parsial Variabel Pendapatan Pengusaha Kuliner Terhadap Variabel
Lahan Parkir Mobil
Hipotesis :
(variabellahan parkir mobil secara parsial tidak berpengaruh
signifikan terhadap variabel pendapatan pengusaha kuliner)
(variabellahan parkir mobil secara parsial berpengaruh signifikan
terhadap variabel pendapatan pengusaha kuliner)
Nilai t stat dan t tabel :
t stat = 1,271
t tabel = 2,1788
df = n – k – 1 = 15 – 2 – 1 = 12
α = 0,05
45. 120
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,1788 <1,271< 2,1788makaHo tidak
dapat ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,228 dan α = 0,05
Ternyata Sig. > α, yaitu 0,228 > 0,05 maka tidak dapat ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel lahan parkir mobil secara parsial tidak
berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner.
ANOVA
b
Model
Sum of
Squares
df Mean Square F Sig.
1
Regression 346473.054 2 173236.527 11.724 .002
a
Residual 177316.546 12 14776.379
Total 523789.600 14
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hipotesis :
(variabel jumlah tenaga kerja dan variabel lahan parkir
mobil secarabersama-sama tidak berpengaruh signifikan
terhadap variabel pendapatan pengusaha kuliner)
(variabel jumlah tenaga kerja dan variabel lahan parkir mobil
secara bersama-sama berpengaruh signifikan terhadap
variabel pendapatan pengusaha kuliner)
46. 121
Nilai F stat dan F tabel :
F stat = 11,724 F tabel = 4,67 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 15 – 2 = 13
Kriteria uji :
iii.Uji tabel F
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
Ternyata F stat > F tabel, yaitu 11,724> 4,67 maka Ho ditolak
iv. Uji Sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,002 dan α = 0,05
Ternyata Sig. < α, yaitu 0,002< 0,05, maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel jumlah tenaga kerjadan variabel lahan
parkir mobilsecara bersama-sama berpengaruh signifikan terhadap variabel
pendapatan pengusaha kuliner.
2. Salah satu penyebab krisis ekonomi di Indonesia yang berkepanjangan adalah belum
membaiknya iklim di sektor riil yang disebabkan masih tingginya suku bunga kredit.
Ada beberapa alasan mengapa suku bunga bank tetap tinggi, yaitu masalah inflasi dan
nilai tukar. Berdasarkan hal tersebut, disusun hipotesis, yaitu suku bunga dipengaruhi
oleh besarnya inflasi dan nilai tukar secara individual. Untuk analisis tersebut, akan
digunakan data dari tahun 1996 sampai 2007. Berikut adalah hasil pengumpulan data
tersebut :
Tahun
Suku Bunga
(% / tahun)
Inflasi
(% / tahun)
Nilai Tukar
(Rp / USD)
1996 20,37 8,91 1905
1997 20,69 9,52 1997
1998 19,25 9,48 2074
1999 15,24 9,77 2118
47. 122
2000 16,77 9,24 2205
2001 16,86 6,09 2305
2002 17,02 6,47 2385
2003 18,49 11,05 5700
2004 25,09 7,63 8025
2005 26,22 2,01 7100
2006 19,55 9,35 9595
2007 19,15 12,55 10435
Dengan menggunakan data tersebut, buatlah persamaan regresinya dan apakah benar
suku bunga dipengaruhi oleh inflasi dan nilai tukar secara individual ?
Jawab :
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 22.644 2.641 8.576 .000
X1 -.651 .284 -.538 -2.296 .047 -.482 -.608 -.535
X2 .001 .000 .532 2.272 .049 .476 .604 .529
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 22,644– 0,651X1 + 0,001X2
Interpretasi :
a = 22,644
Tanpa dipengaruhi oleh variabel apapun, rata – rata suku bunga kredit adalah
sebesar22,644%.
b1 = -0,651
Artinya, setiap kenaikan inflasi sebesar 1%, maka rata – rata suku bunga
kreditakanturun sebesar 0,651%, dengan variabel nilai tukar dianggap konstan.
b2 = 0,001
Artinya setiap kenaikan nilai tukar sebesarRp 1 / USD, maka rata – rata suku
bunga kreditakan naik sebesar 0,001% dengan variabel inflasi dianggap konstan.
48. 123
ANOVA
b
Model Sum of Squares df Mean Square F Sig.
1
Regression 60.597 2 30.298 4.709 .040
a
Residual 57.903 9 6.434
Total 118.500 11
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
b. Uji t statistik :
1. Uji Parsial Variabel Suku Bunga Kredit Terhadap Variabel Inflasi
Hipotesis :
(variabelinflasi secara parsial tidak berpengaruh signifikan
terhadap variabel suku bunga kredit)
(variabelinflasi secara parsial berpengaruh signifikan terhadap
variabel suku bunga kredit)
Nilai t stat dan t tabel :
t stat = -2,296
t tabel = 2,2622
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat˂-ttabel, yaitu -2,296˂-2,2622makaHo ditolak
ii. UjiSig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,047 dan α = 0,05
Ternyata Sig. < α, yaitu 0,047< 0,05 maka ditolak
49. 124
Kesimpulan :
Pada tingkat signifikansi 5%, variabel inflasi secara parsial berpengaruh
signifikan terhadap variabelsuku bunga kredit.
2. Uji Parsial Variabel Suku Bunga Kredit Terhadap Variabel Nilai Tukar
Hipotesis :
(variabelnilai tukar secara parsial tidak berpengaruh signifikan
terhadap variabel suku bunga kredit)
(variabelnilai tukar secara parsial berpengaruh signifikan terhadap
variabel suku bunga kredit)
Nilai t stat dan t tabel :
t stat = 2,272
t tabel = 2,2622
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyatatstat> ttabel, yaitu 2,272> 2,2622makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,049dan α = 0,05
Ternyata Sig. < α, yaitu 0,049< 0,05 maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel nilai tukar secara parsial tidak
berpengaruh signifikan terhadap variabel suku bunga kredit.
50. 125
3. Taufik, The district sales manager for a major automobile manufacturer is studying
car sales. Specifically, he would like to determine what factors affect the number of
cars sold at a dealership. To investigate, he randomly selects 10 dealers. From these
dealers, he obtains the number cars sold last month, the minutes of radio advertising
purchased last month, the number of full-time salespeople employed in the dealership,
and wheter the dealer is located in the city. The information is as follows :
Cars Sold Last Month Advertising Sales Force
City
(No = 0, Yes = 1)
127 18 10 Yes
138 15 15 No
159 22 14 Yes
144 23 12 Yes
139 17 12 No
128 16 12 Yes
161 25 14 Yes
180 26 17 Yes
102 15 7 No
163 24 15 Yes
a. Determine the regression equation, how many cars would to be sold by a
dealership employing 20 salespeople, purchasing 15 minutes of advertising, and
located in a city ?
b. Conduct a global test of hypothesis with α = 5%
c. Conduct a test of hypothesis for the individual regression coefficients. Would you
consider deleting any of the independent variables ? Let α = 5%
Jawab :
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 30.816 7.657 4.024 .007
X1 2.687 .534 .518 5.034 .002 .868 .899 .304
X2 4.713 .612 .600 7.699 .000 .910 .953 .465
X3 -1.513 4.014 -.033 -.377 .719 .546 -.152 -.023
51. 126
a. Regression Equatiom :
Y = 30,818 + 2,687 X1 + 4,713 X2- 1,513 X3
Interpretation :
a = 30,818
Without affected with no variable, the average of cars sold is about 30,818 or 31
unit of cars.
b1 = 2,687
Every increasing of 1 minutes advertising, the average of cars sold will be increase
as much as 2,687 or 3 unit of cars, considering sales force and city variable are
constant.
b2 = 4,713
Every increasing of 1 salespeople, the average of cars sold will be increase as much
as 4,713 or 5 unit of cars, considering advertising and city variable are constant.
b3 = -1,513
Every increasing of 1 point of distantce of the dealer to the city, the average of cars
sold will be decrease as much as 1,513 or 2 unit of cars, considering advertising
and sales force variable are constant.
Estimation :
Advertising = 15 minutes
Sales Force = 20 salespeople
The Dealer near the city (X3 = -1), [X=1 (farther to the city), X=-1 (nearby the city)
Y = 30,818 + 2,687 X1 + 4,713 X2- 1,513 X3
Y = 30,818 + (2,687 x 15) + (4,731 x 20) – (1,513 x -1)
Y = 167,256 ~ 168
So, there would be 168 cars sold by a dealership employing 20 salespeople,
purchasing 15 minutes of advertising, and located in a city.
52. 127
ANOVA
b
Model Sum of Squares df Mean Square F Sig.
1
Regression 4441.505 3 1480.502 89.370 .000
a
Residual 99.395 6 16.566
Total 4540.900 9
a. Predictors: (Constant), X3, X2, X1
b. Dependent Variable: Y
b. Global Hypothesis Test
Hypothesis :
(Advertising, sales force, and dealer location variables
simultaneous don’t affect significantly the amount of cars
sold las month)
(Advertising, sales force, and dealer location variables
simultaneous affect significantly the amount of cars sold
las month)
The Value of F-Stat and F-table :
F stat = 89,370 F tabel = 4,74 α = 0,05
v1 = k – 1 = 3 – 1 = 2
v2 = n – k = 10 – 3 = 7
Criteria :
i.F-Table Test
F stat ≤ F table → Ho accepted
F stat > F table → Ho rejected
F stat > F table, or 89,370> 4,74soHo rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,000andα = 0,05
Sig. < α, or 0,000< 0,05, so rejected
53. 128
Conclusion :
Using 5% significance level, advertising, sales force, and dealer location
variables simultaneous affect significantly to the amount of cars sold last month.
c. t-Test :
1. Partial Test of Advertising Variable to The Amount of Cars Sold
Hypothesis :
(Advertising variable partially doesn’t affect significantly to the
amount of cars sold variable)
(Advertising variable partially affects significantly to the amount
of cars sold variable)
Value of t-stat and t-table :
t stat = 5,034
t table = 2,447
df = n – k – 1 = 10 – 3 – 1 = 6
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat>ttable, or5,034>2,447, so Ho rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,002andα = 0,05
Sig. < α, or0,002< 0,05so rejected
Conclusion :
Using 5% significance level, advertising variable partiallyaffects significantly
to the amount of cars sold last month.
54. 129
2. Partial Test of Sales Force Variable to The Amount of Cars Sold
Hypothesis :
(Sales force variable partially doesn’t affect significantly to the
amount of cars sold variable)
(Sales force variable partially affects significantly to the amount
of cars sold variable)
Value of t-stat and t-table :
t stat = 7,699
t table = 2,447
df = n – k – 1 = 10 – 3 – 1 = 6
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat>ttable, or7,699 > 2,447, so Ho rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,000 and α = 0,05
Sig. < α, or0,000< 0,05so rejected
Conclusion :
Using 5% significance level, sales force variable partiallyaffects significantly
to the amount of cars sold last month.
3. Partial Test of Dealer Location Variable to The Amount of Cars Sold
Hypothesis :
(Dealer location variable partially doesn’t affect significantly to
the amount of cars sold variable)
(Dealer location variable partially affects significantly to the
amount of cars sold variable)
55. 130
Value of t-stat and t-table :
t stat = -0,377
t table = 2,447
df = n – k – 1 = 10 – 3 – 1 = 6
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
-ttable ≤ tstat ≤ ttable, or-2,447 <-0,377< 2,447, so Ho accepted
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,719 and α = 0,05
Sig. ≥ α, or0,719≥ 0,05so accepted
Conclusion :
Using 5% significance level, dealer location variable partiallydoesn’taffects
significantly to the amount of cars sold last month.
Variables Entered/Removed
b
Model Variables Entered Variables Removed Method
1 X3, X2, X1
a
. Enter
a. All requested variables entered.
b. Dependent Variable: Y
There is no variable should be removed or deleted from the model, although
one variable (dealer location) doesn’t affect significantly to the amount of
cars sold last month.
56. 131
4. Menurut para pengusaha di bidang properti, faktor-faktor yang paling mempengaruhi
harga apartemen adalah luas apartemen itu sendiri, jumlah ruangan di dalamnya,
fasilitas apartemen, dan jarak apartemen ke pusat perbelanjaan dan rekreasi. Berikut
ini adalah data yang diperoleh dari beberapa apartemen di Bandung :
Nama Apartemen
Harga
(Rp .000.000)
Luas
(m2
)
Jumlah
Ruangan
Fasilitas
Jarak ke Pusat
Perbelanjaan (Km)
Dago Suites 275 24 2 4 3
Grand Setiabudhi 300 32 3 5 8
Grand Asia Afrika 250 28 3 5 5
Marbella Suites 143 15 2 3 10
Newton Hybrid 460 40 4 6 7
Pasadena 226 35 3 5 15
Pinewood 178 20 2 3 25
The Majesty 294 27 2 3 12
The Jarrdin 330 33 3 6 10
The Edge 312 26 2 6 9
a. Tentukan persamaan regresi dan berikan interpretasinya !
b. Tentukan koefisien determinasi, korelasi sederhana, dan korelasi parsial untuk
semua variabel independen terhadap variabel dependen ! Interpretasikan.
Jawab :
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 66.637 112.822 .591 .580
X1 9.611 6.329 .806 1.519 .189 .799 .562 .360
X2 -22.747 59.483 -.181 -.382 .718 .661 -.169 -.091
X3 8.105 26.863 .117 .302 .775 .704 .134 .072
X4 -3.566 3.771 -.250 -.946 .388 -.450 -.389 -.224
a. Dependent Variable: Y
57. 132
a. Persamaan regresi :
Y = 66,637 + 9,611 X1– 22,747 X2+ 8,105 X3 – 3,566 X4
Interpretasi :
a = 66,637
Tanpa dipengaruhi oleh variabel apapun, rata – rata harag apartemen di Bandung
adalah sebesar Rp 66.637.000.
b1 = 9,611
Artinya, setiap kenaikan luas apartemen sebesar 1 m2
, maka rata – rata harga
apartemen akan naik sebesar Rp 9.611.000 dengan variabel jumlah ruangan,
fasilitas, dan jarak ke pusat perbelanjaan dan rekreasi dianggap konstan.
b2 = -22,747
Artinya setiap kenaikanjumlahruangan apartemen sebanyak1 ruangan, maka rata –
rata harga apartemen akan turun Rp 22.747.000 dengan variabel luas apartemen,
fasilitas, dan jarak ke pusat perbelanjaan dan rekreasi dianggap konstan.
b3 = 8,105
Artinya, setiap kenaikan jumlah fasilitas apartemen sebanyak 1 macam, maka rata
–rata harga apartemen akan naik sebesar Rp 8.105.999 dengan variabel luas
apartemen, jumlah ruangan, dan jarak ke pusat perbelanjaanm dan rekreasi
dianggap konstan.
b4 = -3,566
Artinya setiap kenaikan jarak apartemen ke pusat perbelanjaan dan rekreasi
sebanyak1 km, maka rata – rata harga apartemen akan turun sebesar Rp 3.566.000
dengan variabel luas apartemen, jumlah ruangan, dan fasilitas dianggap konstan.
58. 133
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .848
a
.719 .494 62.50674
a. Predictors: (Constant), X4, X1, X3, X2
Correlations
Y X1 X2 X3 X4
Pearson Correlation
Y 1.000 .799 .661 .704 -.450
X1 .799 1.000 .863 .752 -.248
X2 .661 .863 1.000 .678 -.269
X3 .704 .752 .678 1.000 -.420
X4 -.450 -.248 -.269 -.420 1.000
Sig. (1-tailed)
Y . .003 .019 .011 .096
X1 .003 . .001 .006 .245
X2 .019 .001 . .016 .226
X3 .011 .006 .016 . .113
X4 .096 .245 .226 .113 .
N
Y 10 10 10 10 10
X1 10 10 10 10 10
X2 10 10 10 10 10
X3 10 10 10 10 10
X4 10 10 10 10 10
b.
Koefisien Determinasi : R2
= 0,494 (Adjusted R2
)
Koefisien Non Determinasi : K2
= 1 - R2
= 1 – 0,494 = 0,506
Artinya,variabel luas apartemen, jumlah ruangan, fasilitas, dan jarak apartemen ke
pusat perbelanjaan dan rekreasi mampu menjelaskan variasi dari harga
apartemensebesar 49,4%, dan sisanya sebesar 50,6% dijelaskan oleh faktor lain di
luar model.
Koefisien Korelasi Berganda (R) = 0,848
Artinya, hubungan keseluruhan antara variabel harga apartemen, variabel luas
apartemen, jumlah ruangan, fasilitas, dan jarak apartemen ke pusat perbelanjaan
dan rekreasiadalah searah dan sifatnya erat yaitu sebesar 0,848 atau 84,8%.
59. 134
Koefisien Korelasi Parsial (r)
ry1.234 = 0,799
Artinya hubungan antara variabel luas apartemen secara parsial terhadap variabel
harga apartmenadalah searah dan sifatnya eratdengan nilai sebesar 0,799, dengan
menganggap konstan variabel jumlah ruangan, fasilitas, dan jarak ke pusat
perbeanjaan dan rekreasi.
ry2.134 = 0,661
Artinya hubungan antara variabel jumlah ruangan secara parsial terhadap variabel
harga apartemenadalah searah dan sifatnya cukup eratdengan nilai sebesar
0,661, dengan menganggap konstan variabel luas apartemen, fasilitas, dan jarak ke
pusat perbelanjaan dan rekreasi.
ry3.124 = 0,704
Artinya hubungan antara variabel fasilitas secara parsial terhadap variabel harga
apartmenadalah searah dan sifatnyaeratdengan nilai sebesar 0,704, dengan
menganggap konstan variabel luas apartmen, jumlah ruangan, dan jarak ke pusat
perbelanjaan dan rekreasi.
ry4.123 = -0,405
Artinya hubungan antara variabel jarak ke pusat perbelanjaan dan rekreasi secara
parsial terhadap variabel harga apartmenadalah berlainan arah dan
sifatnyacukup eratdengan nilai sebesar 0,405, dengan menganggap konstan
variabel luas apartmen, jumlah ruangan, dan fasilitas.
r12.y34 = 0,863
Artinya hubungan antara variabel luas apartemen dan variabel jumlah ruangan
secara parsial adalah searah dan sifatnya eratdengan nilai sebesar 0,863, dengan
menganggap variabel lainnya konstan.
r13.y24 = 0,752
Artinya hubungan antara variabel luas apartemen dan variabel fasilitas secara
parsial adalah searah dan sifatnya eratdengan nilai sebesar 0,752, dengan
menganggap variabel lainnya konstan.
r14.y23 = -0,248
Artinya hubungan antara variabel luas apartemen dan variabel jarak ke pusat
perbelanjaan dan rekreasi secara parsial adalah berlainanarah dan sifatnya
sangat lemahdengan nilai sebesar 0,248, dengan menganggap variabel lainnya
konstan.
60. 135
R23.y14 = 0,678
Artinya hubungan antara variabel jumlah ruangan dan variabel fasilitas secara
parsial adalah searah dan sifatnya cukup eratdengan nilai sebesar 0,678, dengan
menganggap variabel lainnya konstan.
R24.y13 = -0,269
Artinya hubungan antara variabel jumlah ruangan dan variabel jarak ke pusat
perbelanjaan dan rekreasi secara parsial adalah berlainanarah dan sifatnya
sangat lemahdengan nilai sebesar 0,269, dengan menganggap variabel lainnya
konstan.
R34.y12 = -0,420
Artinya hubungan antara variabel fasilitas dan variabel jarak ke pusat perbelanjaan
dan rekreasi secara parsial adalah berlainanarah dan sifatnya cukup eratdengan
nilai sebesar 0,420, dengan menganggap variabel penlainnya konstan.
5. Karina owns a catering company that prepares food and beverages for banquets and
parties. But Karina is quite uncertain about her estimation of food-beverage and labor
cost over theoverhead cost estimation, it’s all because of the increase of gasoline
price.The overhead estimation was based on the actual data for the past 12
monthswhich are presented here. These data indicate the overhead cost vary with
direct labor-hours used and electricity used for cooking.
Month Labor Hours Electricity (Kwh) Overhead Cost ($)
January 1500 7400 67000
February 1700 8800 73000
March 2000 9250 65000
April 3100 9480 70000
May 6400 10000 78000
June 4500 10300 71000
July 5500 11210 76500
August 3400 6900 68700
September 6000 8000 75430
October 3500 7760 72990
November 3100 7600 70400
December 5300 9520 74000
61. 136
a. Determine regression equation for Karina’s Catering Company, then interpret it!
b. Determine determination and nondetermination coefficient and interpret the value!
c. Find the difference between predicted overhead cost variable and actual overhead
cost !
d. Determine the multiple regression correlation coefficient and all possible partial
correlation ! How strong it is ?
e. Conduct a global test of hypothesis with α = 5% !
f. Using α = 5%, conduct a test of hypothesis for the individual regression
coefficients !
Jawab :
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 62878.868 5088.530 12.357 .000
X1 1.783 .500 .775 3.568 .006 .813 .765 .687
X2 .240 .636 .082 .377 .715 .440 .125 .073
a. Dependent Variable: Y
a. Regression Equation :
Y = 62.878,868 + 1,783 X1 + 0,24 X2
Interpretation :
a = 62.878,868
Without affected with no variable, the average of overhead cost is about
$62.878,868.
b1 = 1,783
Every increasing of 1 hour of labor-hour, the average of overhead cost will be
increase as much as $1,783, considering electricity variable is constant.
b2 = 0,240
Every increasing of 1 Kwh of electricity, the average of overhead cost will be
increase as much as $0,240, considering labor-hour variable is constant.
62. 137
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .816
a
.666 .592 2482.01916
a. Predictors: (Constant), X2, X1
b. Determination Coefficient : R2
= 0,592 (Adjusted R2
)
Nondetermination Coefficient: K2
= 1 - R2
= 1 – 0,592 = 0,408
It means that labor hour and electricity variable explained the variation of overhead
cost of Karina’s Catering Company as much as 59,2%,and the 40,8%
residualvalueis explained by another factor out of the model.
c. Standard Error of Estimate (SE)
SE = 2482,01916
It means that the difference between predicted overhead cost variable and actual
overhead cost is about $2482,01916.
d. Multiple Regression Correlation (R) = 0,986
A whole relation between overhead cost, labor hour, dan electricity variable is
positive and have a very strong relation, it’s 0,986.
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .813 .440
X1 .813 1.000 .463
X2 .440 .463 1.000
Sig. (1-tailed)
Y . .001 .076
X1 .001 . .065
X2 .076 .065
.
N
Y 12 12 12
X1 12 12 12
X2 12 12 12
63. 138
ry1.2 = 0,813
The relation between labor hour variable partially to overhead cost variable is
positive and strong with 0,813 value of correlation, considering electricity variable is
constant.
ry2.1 = 0,440
The relation between electricity variable partially to overhead cost variable is
positive and strong enough with 0,440 value of correlation, considering labor hour
variable is constant.
r12.y = 0,463
The partial relation between labor hour and electricity variable partially is positive
and strong enough with 0,463 value of correlation, considering overhear cost
variable is constant.
e. Global Hypothesis Test (F-Test)
ANOVA
b
Model Sum of Squares df Mean Square F Sig.
1
Regression 110674528.067 2 55337264.034 8.983 .007
a
Residual 55443771.933 9 6160419.104
Total 166118300.000 11
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hypothesis :
(Labor hour and electricity variables simultaneous don’t affect
significantly the overhead cost)
(Labor hour and electricity variables simultaneous affect
significantly the overhead cost)
The Value of F-Stat and F-table :
F stat = 8,983 F tabel = 4,96 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 12 – 2 = 10
64. 139
Criteria :
i. F-Table Test
F stat ≤ F table → Ho accepted
F stat > F table → Ho rejected
F stat > F table, or 8,983> 4,96soHo rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,007 and α = 0,05
Sig. < α, or 0,007 < 0,05, so rejected
Conclusion :
Using 5% significance level, advertising, sales force, and dealer location
variables simultaneous affect significantly to the amount of cars sold last month.
f. Individual Hypothesis Test (t-Test)
1. Partial Test of Labor Hour Variable to The Overhead Cost
Hypothesis :
(Labor hour variable partially doesn’t affect significantly to the
overhead cost variable)
(Labor hour variable partially affects significantly to the overhead
cost variable)
Value of t-stat and t-table :
t stat = 3,568
t table = 2,262
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat>ttable, or3,568 > 2,262, so Ho rejected
65. 140
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,006 and α = 0,05
Sig. < α, or0,006< 0,05so rejected
Conclusion :
Using 5% significance level, labor hour variable partiallyaffects significantly
to the overhead cost of Karina’s Catering Company.
2. Partial Test of ElectricityVariable to The Overhead Cost
Hypothesis :
(Electricity variable partially doesn’t affect significantly to the
overhead cost variable)
(Electricity variable partially affects significantly to the overhead
cost variable)
Value of t-stat and t-table :
t stat = 0,377
t table = 2,262
df = n – k – 1 = 12 – 2 – 1 = 9
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
-ttable ≤ tstat ≤ ttable, or-2,262<0,377 < 2,262, so Ho accepted
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,715 and α = 0,05
Sig. ≥ α, or0,715≥ 0,05so accepted
66. 141
Conclusion :
Using 5% significance level, electricity variable partiallydoesn’taffects
significantly to the overhead cost of Karina’s Catering Company.
6. Consider a study designed to examine the role of television viewing in the lives of
selected group of people over 65 years of age. The purpose of the study was to
provide guidelines for developing television programming that would adequately
meet the special needs of the audience. A sample of 25 senior citizen was selected and
from each senior citizen the following data were obtained : y = the average number of
hours per day an interviewee spend watching television; x1 = the age of the
interviewee; and x3 = the number of years of education of the interviewee. The data
are listed below :
Individual Hours Age Education
A 0,5 73 14
B 0,5 66 16
C 0,7 65 15
D 0,8 65 16
E 0,8 68 9
F 0,9 69 10
G 1,1 82 12
H 1,6 83 12
I 1,6 81 12
J 2,0 72 10
K 2,5 69 8
L 2,8 71 16
M 2,8 71 12
N 3,0 80 9
O 3,0 71 6
P 3,0 75 6
Q 3,2 76 10
R 3,2 78 6
S 3,3 79 6
T 3,3 79 4
67. 142
U 3,4 78 6
V 3,5 76 9
W 3,6 65 12
X 3,7 72 12
Y 3,7 80 6
a. Determine regression equation for this study, then interpret it!
b. Determine determination and nondetermination coefficient and interpret the value!
c. Find the difference between predicted average number of hours spent by
interviewee for watching televison variable and actual value of that dependent
variable !
d. Determine the multiple regression correlation coefficient and all possible partial
correlation ! How strong it is ?
e. Conduct a global test of hypothesis with α = 5% !
f. Using α = 5%, conduct a test of hypothesis for the individual regression
coefficients !
Jawab :
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 3.355 3.182 1.054 .303
X1 .010 .038 .053 .272 .788 .328 .058 .046
X2 -.178 .061 -.571 -2.928 .008 -.596 -.530 -.500
a. Dependent Variable: Y
a. Regression Equation :
Y = 3,355 + 0,01 X1–0,178 X2
Interpretation :
a = 3,355
Affected with no variable, the average hours that the interviewee spent for
watching television is about 3,355 hours.
68. 143
b1 = 0,01
Every increasing of 1 year age, the average hours that the interviewee spent for
watching television will be increase as much as 0,01 hours, considering education
variable is constant.
b2 = -0,178
Every increasing of 1 year of education, the average hours that the interviewee
spent for watching television will be decrease as much as 0,178 hours, considering
age variable is constant.
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .598
a
.358 .299 .94240
a. Predictors: (Constant), X2, X1
b. Determination Coefficient : R2
= 0,299 (Adjusted R2
)
Nondetermination Coefficient : K2
= 1 - R2
= 1 – 0,299 = 0,701
It means that age and education variable explained the variation of time spent for
watching televison as much as 29,9%,and the 70,1% residualvalueis explained by
another factor out of the model.
c. Standard Error of Estimate (SE)
SE = 0,94240
It means that the difference between predicted time spent for watching television
variable and actual time spent for watching television is about 0,94240 hours.
d. Multiple Regression Correlation (R) = 0,598
A whole relation between time spent by interviewee for watching televison, age, and
education variable is positive and have a strong enough correlation, it’s 0,598.
69. 144
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .328 -.596
X1 .328 1.000 -.482
X2 -.596 -.482 1.000
Sig. (1-tailed)
Y . .055 .001
X1 .055 . .007
X2 .001 .007 .
N
Y 25 25 25
X1 25 25 25
X2 25 25 25
ry1.2 = 0,328
The relation between age variable partially to time spent by inteviewee for watching
television variable is positive and weak with 0,328 value of correlation, considering
education variable is constant.
ry2.1 = -0,596
The relation between education variable partially to time spent by inteviewee for
watching televisionvariable is negative and strong enough with 0,596 value of
correlation, considering age variable is constant.
r12.y = -0,482
The partial relation between age and education variable is negative and strong
enough with 0,482 value of correlation, considering the time spent by inteviewee for
watching televisionvariable is constant.
e. Global Hypothesis Test (F-Test)
ANOVA
b
Model Sum of Squares df Mean Square F Sig.
1
Regression 10.888 2 5.444 6.130 .008
a
Residual 19.539 22 .888
Total 30.426 24
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
70. 145
Hypothesis :
(Age and education variables simultaneous don’t affect
significantly the time spent by inteviewee for watching
television)
(Age and education variables simultaneous affect significantly
the time spent by inteviewee for watching television)
The Value of F-Stat and F-table :
F stat = 6,130 F tabel = 4,24 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 25 – 2 = 23
Criteria :
j. F-Table Test
F stat ≤ F table → Ho accepted
F stat > F table → Ho rejected
F stat > F table, or 6,130> 4,24soHo rejected
iii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,008 and α = 0,05
Sig. < α, or 0,008< 0,05, so rejected
Conclusion :
Using 5% significance level, age and education variables simultaneous affect
significantly to the time spent by inteviewee for watching television.
f. Individual Hypothesis Test (t-Test)
1. Partial Test of AgeVariable to The Time Spent By Inteviewee For
Watching Television
Hypothesis :
(Age variable partially doesn’t affect significantly to the time
spent by inteviewee for watching television variable)
(Age variable partially affects significantly to the time spent by
inteviewee for watching televisionvariable)
71. 146
Value of t-stat and t-table :
t stat = 0,272
t table = 2,074
df = n – k – 1 = 25 – 2 – 1 = 22
α = 0,05
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
-ttable ≤ tstat ≤ ttable, or-2,074 < 0,272 < 2,262, so Ho accepted
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,788 and α = 0,05
Sig. ≥ α, or0,788< 0,05so accepted
Conclusion :
Using 5% significance level, age variable partiallydoesn’t affectsignificantly
to the time spent by inteviewee for watching television.
2. Partial Test of EducationVariable to The Time Spent By Inteviewee For
Watching Television
Hypothesis :
(Education variable partially doesn’t affect significantly to the
time spent by inteviewee for watching televisionvariable)
(Education variable partially affects significantly to the time spent
by inteviewee for watching televisionvariable)
Value of t-stat and t-table :
t stat = -2,928
t table = 2,074
df = n – k – 1 = 25 – 2 – 1 = 22
α = 0,05
72. 147
Criteria :
i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted
tstat< -ttable→ Ho rejected
tstat> ttable→ Ho rejected
tstat< -ttable, or-2,928<-2,074, so Ho rejected
ii. Sig. Test
Sig. ≥ α → accepted
Sig. < α → rejected
Sig. = 0,008 and α = 0,05
Sig. < α, or0,008< 0,05so rejected
Conclusion :
Using 5% significance level, education variable partiallyaffects significantly
to the time spent by inteviewee for watching television.
7. Deasy, pemilik perkebunan tembakau yang relatif besar di Sumedang, selama 2 tahun
terakhir, Deasy melakukan uji coba pemberian 2 jenis pupuk pada tanaman
tembakaunya demi mendapatkan tembakau dengan kualitas terbaik, yaitu pupuk jenis
Zwazelzure Kali (ZK) dan pupuk jenis Zwazelzure Amoniak (ZA). Tembakau jenis
ini dipanen setiap 4 bulan sekali, sehingga didapat 8 data penggunaan kedua jenis
pupuk terhadap hasil panen tembakau. Berikut data yang berhasil diperoleh :
Waktu Panen
Hasil Panen
(Kw)
Pupuk ZK
(Kg)
Pupuk ZA
(Kg)
Panen I 160 75 60
Panen II 200 125 100
Panen III 250 130 125
Panen IV 185 100 97
Panen V 300 170 156
Panen VI 325 175 160
Panen VII 400 230 218
Panen VIII 500 200 230
73. 148
a. Tentukan persamaan regresinya dan interpretasikan !
b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial
!Interpretasikan !
c. Lakukan pengujian secara parsial antar variabel hasil panen dan jumlah pupuk
ZK yang digunakan, juga variabel hasil panen dan jumlah pupuk ZA yag
digunakan, dengan tingkat signifikansi 5% !
d. Lakukan pengujian simultan antara variabel jumlah pupuk ZK dan variabel
jumlah pupuk ZA yang digunakan terhadap variabel hasil panen tembakau !
e. Jika anda juga memiliki perkebunan tembakau, apakah anda harus menambah
pupuk ZK saja, pupuk ZA saja, atau keduanya ?
Jawab :
Coefficients
a
Model
Unstandardized
Coefficients
Standardized
Coefficients t Sig.
Correlations
B Std. Error Beta Zero-order Partial Part
1
(Constant) 54.154 27.025 2.004 .101
X1 -1.286 .586 -.576 -2.195 .080 .902 -.700 -.152
X2 2.998 .513 1.532 5.839 .002 .976 .934 .403
a. Dependent Variable: Y
a. Persamaan regresi :
Y = 54,154–1,286 X1 + 2,998 X2
Interpretasi :
a = 54,154
Tanpa dipengaruhi oleh variabel apapun, rata – rata hasil panen yang
dihasilkanadalah sebanyak 54,154 Kwintal.
b1 = -1,286
Artinya, setiap kenaikan penggunaan pupuk ZK sebanyak 1 Kg, maka rata – rata
hasil panen akan turun sebesar 1,286 Kwintal dengan variabel penggunaan pupuk
ZA dianggap konstan.
74. 149
b2 = 2,998
Artinya, setiap kenaikan penggunaan pupuk ZA sebanyak 1 miliar rupiah, maka rata
– rata hasil panen akan naik sebanyak2,998 Kwintal dengan variabel penggunaan
pupuk ZK dianggap konstan.
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .988
a
.976 .967 21.29678
a. Predictors: (Constant), X2, X1
b. Koefisien determinasi : R2
= 0,967 (Adjusted R2
)
Koefisien nondeterminasi : K2
= 1 - R2
= 1 – 0,967 = 0,033
Artinya,variabel penggunaan pupuk ZKdanvariabel penggunaan pupuk ZA mampu
menjelaskan variasi dari hasil panen Tembakausebesar 96,7%, dan sisanya sebesar
3,3% dijelaskan oleh faktor lain di luar model.
c. Standard Error of Estimate (SE)
SE = 21,29678
Artinya, rata-rata penyimpangan variabel hasil panen tembakau yang diprediksi dengan
variabel hasil panen tembakau yang sebenarnya adalah sebanyak21,29678 Kwintal.
d. Koefisien korelasi berganda (R) = 0,988
Artinya, hubungan keseluruhan antara variabel hasil panen tembakau,
variabelpenggunaan pupuk ZK, dan variabel penggunaan pupuk ZAadalah searah dan
sifatnya sangat erat yaitu sebesar 0,988.
Correlations
Y X1 X2
Pearson Correlation
Y 1.000 .902 .976
X1 .902 1.000 .965
X2 .976 .965 1.000
Sig. (1-tailed)
Y . .001 .000
X1 .001 . .000
X2 .000 .000 .
N
Y 8 8 8
X1 8 8 8
X2 8 8 8
75. 150
Koefisien Korelasi Parsial :
ry1.2 = 0,902
Artinya hubungan antara variabel penggunaan pupuk ZK secara parsial terhadap
variabel hasil panen tembakauadalahsearah dan sifatnya sangat erat dengan nilai
sebesar 0,902, dengan menganggap variabel penggunaan pupuk ZA ekspor konstan.
ry2.1 = 0,976
Artinya hubungan antara variabel penggunaan pupuk ZA secara parsial terhadap
variabel hasil panen tembakauadalahsearah dan sifatnya sangat erat dengan nilai
sebesar 0,976, dengan menganggap variabel penggunaan pupuk ZK konstan.
r12.y = 0,965
Artinya hubungan antara variabel penggunaan pupuk ZK dan variabel penggunaan
pupuk ZA secara parsial adalahsearah dan sifatnya sangat eratdengan nilai sebesar
0,965, dengan menganggap variabel hasil panen tembakau konstan.
e. Uji t statistik :
1. Uji Parsial variabel Hasil Panen terhadap Variabel Penggunaan Pupuk ZK
Hipotesis :
(variabelpenggunaan pupuk ZK secara parsial tidak berpengaruh
signifikanterhadap variabel hasil panen tembakau)
(variabelpenggunaan pupuk ZK secara parsial berpengaruh
signifikanterhadap variabel hasil panen tembakau)
Nilai t stat dan t tabel :
t stat = -2,195
t tabel = 2,571
df = n – k – 1 = 8 – 2 – 1 = 5
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,571< -2,195 <2,571makaHo tidak dapat
ditolak
76. 151
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,08 dan α = 0,05
Ternyata Sig. ≥ α, yaitu 0,08≥ 0,05 maka tidak dapat ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZK secara parsial tidak
berpengaruh signifikan terhadap variabel hasil panen tembakau
2. Uji Parsial Variabel Hasil PanenTerhadap Variabel Penggunaan Pupuk ZA
Hipotesis :
(variabelpenggunaan pupuk ZA secara parsial tidak berpengaruh
signifikanterhadap variabel hasil panen tembakau)
(variabelpenggunaan pupuk ZA secara parsial berpengaruh
signifikan terhadap variabel hasil panen tembakau)
Nilai t stat dan t tabel :
t stat = 5,839
t tabel = 2,571
df = n – k – 1 = 8 – 2 – 1 = 5
α = 0,05
Kriteria uji :
i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak
tstat< -ttabel→ Ho ditolak
tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 5,839> 2,571makaHo ditolak
ii. Uji sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,002 dan α = 0,05
Ternyata Sig. < α, yaitu 0,008 < 0,05 maka ditolak
77. 152
Kesimpulan :
Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZA secara parsial
berpengaruh signifikan terhadap variabel hasil panen tembakau.
g. Uji F statistik
ANOVA
b
Model Sum of Squares df Mean Square F Sig.
1
Regression 92882.235 2 46441.118 102.394 .000
a
Residual 2267.765 5 453.553
Total 95150.000 7
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hipotesis :
(variabelpenggunaan pupuk ZKdan variabel penggunaan
pupuk ZA secarabersama-sama tidak berpengaruh
signifikan terhadap variabel hasil panen tembakau)
(variabelpenggunaan pupuk ZK dan variabel penggunaan
pupuk ZA secara bersama-sama berpengaruh signifikan
terhadap variabel hasil panen tembakau)
Nilai F stat dan F tabel :
F stat = 102,394 F tabel = 5,99 α = 0,05
v1 = k – 1 = 2 – 1 = 1
v2 = n – k = 8 – 2 = 6
Kriteria uji :
i. Uji tabel F
F stat ≤ F tabel → Ho tidak dapat ditolak
F stat > F tabel → Ho ditolak
Ternyata F stat > F tabel, yaitu 102,394>5,99 maka Ho ditolak
78. 153
ii. Uji Sig.
Sig. ≥ α → tidak dapat ditolak
Sig. < α → ditolak
Sig. = 0,000 dan α = 0,05
Ternyata Sig. < α, yaitu 0,000< 0,05, maka ditolak
Kesimpulan :
Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZKdan variabel
penggunaan pupuk ZAsecara bersama-sama berpengaruh signifikan terhadap
variabel hasil panen tembakau.
79. 154
CHI-SQUARE
Bila kita mempunyai dua macam proporsi dan kita ingin menguji apakah perbedaan antar
kedua proporsi itu signifikan atau tidak, maka disini kita menggunakan pengujian hipotesa mengenai
beda dua proporsi. Perluasan dari pada pengujian selisih proporsi (beda antara dua proporsi) adalah
pengujian Chi Kuadrat, karena didalam pengujian ini kita mengadakan pengujian hipotesa tentang
perbedaan proporsi dari proporsi yang banyaknya lebih dari dua. Dengan perkataan lain, pengujian 2
ada-lah pengujian hipotesa mengenai perbe-daan k proporsi dimana k 2 proporsi.
Chi square merupakan suatu ukuran yang menyangkut perbedaan yang terdapat di antara
frekuensi pengamatan dengan frekuensi teoritis/frekuensi harapan (Schaum’s). Maksud dari pengujian
chi square adalah untuk membandingkan fakta yang diperoleh berdasarkan hasil observasi dan fakta
yang didasarkan secara teoritis (Drs. Andi Supangat, M.Si.) Dalam statistik, distribusi chi-square
(dilambangkan dengan χ2
BUKAN X2
) termasuk dalam statistik nonparametrik. Distribusi
nonparametrik adalah distribusi dimana besaran-besaran populasi tidak diketahui. Distribusi ini sangat
bermanfaat dalam melakukan analisis statistik jika kita tidak memiliki informasi tentang populasi atau
jika asumsi-asumsi yang dipersyaratkan untuk penggunaan statistik parametrik tidak terpenuhi.
Berikut ini beberapa hal yang berhubungan dengan chi square:
a. Adanya derajat kebebasan/ degree of freedom (df). Besarnya df menunjukan banyak observasi
yang bebas untuk bervariasi sesudah batasan-batasan tertentu dikenakan pada data. (Sidney
Siegel)
b. Chi-square tidak pernah bernilai negatif. Hal ini dikarenakan selisih antara frekuensi data
observasi )( of dengan frekuensi data yang diharapkan ef dikuadratkan, yaitu 2
eo ff
c. Jika χ2
= 0 maka frekuensi-frekuensi teoritis sama dengan frekuensi pengamatan. Jika χ2
>0 maka
frekuensi-frekuensi teoritis tidak tepat sama dengan frekuensi pengamatan. Semakin besar nilai
χ2
semakin besar pula perbedaan antara frekuensi yang diobservasi dan frekuensi teoritis.
d. Distribusi chi-square adalah menceng kanan. Jika n nya sangat besar maka distribusi χ2
ini
mendekati distribusi normal.
1. Penaksiran Standar Deviasi
Dalam pembahasan sebelumnya telah di sampaikan bahwa pada umumnya ada dua
cara menaksir, yakni titik taksiran dan interval taksiran. Titik taksiran untuk σ2
digunakan
varians dari sampel yang dipakai sebagai bahan untuk menaksir. Guna mendapatkan interval
taksiran parameter σ maka:
80. 155
rumus : 2
2/1
2
2
2/
2
)1()1(
nsns
; df = n-1
dimana: s = standar deviasi
n = banyaknya data yang diobservasi
α = tingkat signifikansi
2
2/ dan 2
2/1 didapat dari daftar distribusi chi-square dengan df = n-1 dan p
masing-masing sama dengan
2
dan 1-
2
.
Uji Hipotesis Standar Deviasi
Langkah-langkah pengujian standar deviasi:
1. Tentukan hipotesis awal dan alternatifnya
Uji dua pihak
Ho : a
Ha : a
Uji pihak kanan
Ho : a
Ha : a
Uji pihak kiri
Ho : a
Ha : a
2. Tentukan uji kriteria distribusi χ dengan df = n-1 dan tingkat signifikansi α
3. Lakukan uji statistik pada data yang diobservasi dengan menggunakan rumus:
1
ns
; df = n-1
4. Bandingkan nilai χ dengan nilai distribusi χ yang telah didapat pada langkah sebelumnya
sesuai kriteia uji yang digunakan
5. Buat kesimpulan
Uji dua pihak Uji pihak kanan Uji pihak kiri
Ho tidak dapat
ditolak
2/2/1 1
Ho ditolak
2/1
2/
1
81. 156
2. Uji Chi-Square Dari Data Multinomial
Uji ini dilakukan untuk meneliti peristiwa yang terdiri lebih dari dua golongan.
Eksperimen yang dilakukan sebanyak n kali dan hasilnya dicatat, dikumpulkan menrut
golongan atau kategorinya masing-masing lalu diperoleh sebuah data, data yang diperoleh
demikian dinamakan data multinomial.(Sudjana)
Langkah-langkah:
1. Tentukan hipotesis awal dan hipotesis alternatifnya
Ho : c ...321
Ha : terdapat paling sedikit satu tanda ≠
2. Tentukan nilai 2
pada distribusi chi-square dengan df = c-1 dan tingkat signifikansi α
dimana c adalah banyaknya kolom dari data.
3. Lakukan uji statistik dengan menggunakan rumus
j
ji
e
eo 2
2
)(
Dimana:
oi = data hasil observasi
ej = data yang diharapkan atau diestimasikan
4. lakukan uji kriteria dengan membandingkan nilai 2
dan 2
, yaitu:
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
5. Buat kesimpulan
3. Uji Chi-Square dari Tabel Kontingensi
Tabel kontingensi merupakan tabel klasifikasi dua arah yang terdiri dari banyak
kolom dan banyak baris yang merupakan pengambangan konsep dari uji chi-square data
multinomial yang menggunakan tabel klasifikasi satu arah atau hanya sebuah variabel saja.
Langkah-langkah:
1. Tentukan hipotesis awal dan alternatifnya
Ho : c1131211 ...
c
c
3333231
2232221
...
...
Ha : terdapat paling sedikit satu tanda ≠
82. 157
2. Tentukan nilai 2
dari distribusi chi-square dengan tingkat signifikansi α dan
df = (r-1).(c-1), dimana r adalah banyaknya baris dari data dan c adalah banyaknya
kolom dari data.
3. Lakukan uji statistik dengan menggunakan rumus:
ij
ijij
e
eo
2
2
Dimana:
oij= data hasil observasi dari baris ke-i kolom ke-j
eij= data hasil estimasi dari baris ke-i kolom ke-j
4. Tentukan uji kriterianya
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
5. Buat kesimpulan
Koefisien Kontingensi (C)
Koefisien kontingensi yaitu bilangan yang digunakan untuk menentukan derajat
hubungan antara dua faktor yang telah disusun dalam daftar kontingensi.
Rumus:
n
C
2
2
dengan nilai maksimum
m
m
C
1
max
Dimana:
n = banyaknya data
m = banyaknya baris atau kolom minimal
keterangan:
Cmax-C < C, hubungan erat
Cmax-C = C, hubungan cukup erat
Cmax-C > C, hubungan kurang erat
Contoh Soal
Dilakukan suatu penelitianterhadap seorang penjual sepatu untuk mengetahui apakah
ada pengaruh warna sepatu terhadap banyaknya sepatu yang terjual. Berikut adalah hasil
pengamatan sepatu berbagai warna selama satu periode tertentu:
83. 158
Warna Sepatu Hitam Putih Biru Coklat Total
Sepatu yang
terjual (unit)
90 55 25 30 200
Pada tingkat signifikansi 1% dapatkah disimpulkan bahwa warna sepatu tersebut berpengaruh
terhadap banyaknya sepatu yang terjual?
Jawab:
Ho: 4321
Ha: terdapat paling sedikit satu ≠
df = c-1= 4-1 = 3
α = 1%
2
= 11, 3449
Uji statistik:
50
4
200
e
o
ej
53
50
5030
50
5025
50
5055
50
5090
22222
2
e
eo
Uji kriteria:
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
Ternyata 53>11,3449 atau 22
→ Ho ditolak
Pada tingkat signifikansi 1% hasil pengamatan diatas menunjukkan bahwa warna sepatu
mempengaruhi banyaknya sepatu yang terjual karena perbedaannya signifikan.
84. 159
SOAL CHI-SQUARE
1. Banyaknya orang yang berbelanja ke sebuah toko setiap hari selama 6 hari adalah sebagai
berikut :
Apakah banyaknya orang yang berbelanja itu tergantung dari nama-nama hari ataukah
tidak?
Penyelesaian
1) . H0 : banyaknya orang yang berbelanja ke toko itu tidak tergantung pada
nama hari.
H1 : banyaknya orang yang berbelanja ke toko itu tergantung pada nama hari.
2) df = k – 1 = 6 – 1 = 5
α = 0,05
χα
2
= 11,0705
3)
4) . Kriteria:
H0 diterima
H0 ditolak
5) Ternyata :
H0 diterima
6) Kesimpulan :
Meskipun banyaknya orang berbelanja tiap hari tidak sama, akan tetapi
karena perbedaan hari itu tidak signifikan, maka banyaknya orang
yang berbelanja ke toko tersebut setiap harinya selama seminggu
adalah sama.
2. Ada yang berpendapat bahwa pekerja-pekerja yang berasal dari dalam kota pada
umunya kurang rajin bila dibandingkan dengan pekerja-pekerja dari luar kota. Untuk
menguji pendapat ini diadakan penilaian terhadap kerajinan bekerja dari 50 orang
pekerja dan diperoleh data seperti dibawah ini :
Hari Senin Selasa Rabu Kamis Jumat Sabtu
Jumlah yang
berbelanja
127 112 121 109 132 149
56,8
125
125149
....
125
125112
125
125127
222
2
85. 160
Penyelesaian
1) H0 : tingkat kerajinan dengan asal pekerja tidak ada hubungan (independen).
H1 : tingkat kerajinan dengan asal pekerja ada hubungan (dependen).
2) df = (r – 1).(k – 1) = (2 – 1).(2 – 1) = 1
α = 5% = 0,05
χα
2
= 3,841
3)
Kerajinan Pekerja
Asal Pekerja
Rajin Kurang Rajin
Dalam Kota (30).(10)/50 = 6 (20).(10)/50 = 4
Luar Kota (30).(40)/50 = 24 (20).(40)/50 =16
Kerajinan Pekerja
Asal Pekerja
Rajin Kurang Rajin
Dalam Kota 5
6
5
4
Luar Kota 25
24
15
16
Kerajinan Pekerja
Asal Pekerja
Rajin Kurang Rajin
Dalam Kota 5 5
Luar Kota 25 15
86. 161
4) . Kriteria:
H0 tidak ditolak
H0 ditolak
5) Ternyata :
<
H0 tidak ditolak
6) Kesimpulan :
Kita tidak menolak hipotesa. Dengan perkataan lain, tidak terdapat hubungan antara
kerajinan pekerja dengan asal pekerja.
3. Simpangan baku dari masa hidup semacam lampu pijar adalah 36 jam dengan sampel
26 buah. Tentukanlah batas-batas taksiran simpangan baku dari masa hidup seluruh
produksi lampu, dengan menggunakan tingkat kepercayaan 95%!
Dik : s = 36 n = 26 α = 5%
Dit : taksiran simpangan baku
Jawab :
Df = 25
= 40,6465 ( ) = 13,91197
2
2/1
2
2
2/
2
)1()1(
nsns
√
( )
√
( )
28,2325349 48,2589856
Dengan tingkat signifikansi 5% maka batas-batas taksiran simpangan baku dari masa hidup
seluruh produksi lampu adalah antara 28,2325349 jam dan 48,2589856 jam.
87. 162
4. The Federal Correction Agency wants to investigate the question citied below: Does a
male released from federal prison make a different adjustment to civilian life if he
returns to his hometown or if he goes elsewhere to live? The agency’s psychologist
interviewed 200 randomly selected former prisoners.
Adjustment to civilian life
Residence After
Released from Prison
Outstanding Good Fair Unsatisfactory
Hometown 27 35 33 25
Not Hometown 13 15 25 25
To put it another way, is there a relationship between adjustment to civilian life and place
of residence after released from prison?
Dik : Ho :there is no relationship between adjustment to civilian life and place of
residence after released from prison
Ha : there is a relationship between adjustment to civilian life and place of residence after
released from prison
df= (r-1)(c-1)=(2-1)(4-1)= 3
α = 1% 2
= 11,345
Residence After
Released from Prison
Outstanding Good Fair Unsatisfactory Total
Hometown 27 35 33 25 120
Not Hometown 13 15 25 25 80
Total 40 50 60 50 200
88. 163
o
oo
e
ojio
ij
ij
ijij
e
eo
2
2
( ) ( ) ( ) ( ) ( ) ( )
( ) ( )
22
→ Ho tidak dapat ditolak
22
→ Ho ditolak
Ternyata <11,345 maka 22
→ Ho tidak dapat ditolak
At 1% significance level there is no relationship between adjustment to civilian life and place
of residence after released from prison
5. Simpangan baku dari kekuatan semacam kabel yang dihasilkan oleh perusahaan X
adalah 100 kg. Didapat data dari industri penjualan kabel bahwa berdasarkan 8
sampel kabel yang diteliti, nilai simpangan bakunya adalah 120 kg. Telitilah, apakah
proses dalam pebuatan kabel perusahaan X mengalami perubahan variasi kekuatan
kabel yang berarti atau tidak? Ujilah dengan tingkat signifikansi 1%!
89. 164
Penyelesaian
Dik : s = 100 kg
n = 8
σ = 120 kg
df = n-1= 8-1 = 7
α = 1%
Dit : apakah proses dalam pebuatan kabel perusahaan X mengalami perubahan variasi
kekuatan kabel yang berarti atau tidak
Jawab :
Ho : σ = 120
Ha : σ ≠120
2048,2
120
18100
Uji Kriteria:
2/2/1 → ho tidak dapat ditolak
2/1
2/
→ ho ditolak
Ternyata 0,99462 < 2,2048 < 4,50308 maka 2/2/1 → ho tidak dapat ditolak
Dengan tingkat signifikansi 1% maka proses dalam pebuatan kabel perusahaan X tidak
mengalami perubahan variasi kekuatan kabel yang berarti.
6. In a particular television market there are three commercial television stations, each
with its own evening news program from 06.00 to 06.30 pm. According to a report in
this morning’s local newspaper, a random sample of 180 viewers last night revealed
53 Watched the news on channel 5, 64 watched on channel 11, 33 on channel 13and
30 watched on channel 19. At the 0,05 significance level, is there a difference in the
proportion of viewers watching the three channels?
50308,42777,20
99462,0989265,0
2/
2/1
1
ns