TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...
PPNCKT_Chuong 3 p3
1. 1
11
Chọn mẫu
Một số khái niệm
Đám đông/tổng thể (population) là tập hợp tất cả các
đối tượng nghiên cứu (cần thu thập dữ liệu từ họ)
mà nhà nghiên cứu cần nghiên cứu để thỏa mãn
mục đích và phạm vi nghiên cứu của mình.
Mẫu (sample) là một bộ phận của tổng thể được
chọn ra để quan sát và dùng để suy diễn cho toàn
bộ tổng thể.
Phần tử (element) là đối tượng cần thu thập dữ liệu,
thường được gọi là đối tượng nghiên cứu – đối
tượng thu thập dữ liệu.
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
22
Tập hợp lấy mẫu -
TỔNG THỂ
MẪU
KẾT QUẢ THỐNG KÊ
Chọn mẫu
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
33
Đơn vị chọn mẫu (sampling unit) là các nhóm nhỏ
của đám đông có cùng những đặc tính cần thiết cho
việc chọn mẫu
Đơn vị cuối cùng có thể chia nhỏ được của mẫu chính là
phần tử mẫu
Khung mẫu hay khung chọn mẫu (sampling frame)
là danh sách liệt kê dữ liệu cần thiết tất cả các đơn
vị và phần tử của đám đông để thực hiện công việc
chọn mẫu
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
2. 2
4
Lý do chọn mẫu
Tiết kiệm chi phí
Tiết kiệm thời gian
Đảm bảo tính kịp thời
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
5
Chọn mẫu và sai số
Sai số do chọn mẫu (sampling error SE) là các sai số
gây ra do việc chọn mẫu để thu thập dữ liệu, và từ
thông tin của mẫu này ta có thể suy ra thông tin của
đám đông/tổng thể thay vì thu thập dữ liệu của toàn
bộ đám đông nghiên cứu.
sai số này luôn luôn xuất hiện khi chọn mẫu
Sai số không do chọn mẫu (non-sampling error
NE) là các sai số còn lại, phát sinh trong quá trình
thu thập dữ liệu như quá trình phỏng vấn, hiệu
chỉnh, nhập dữ liệu.
sai số này càng tăng khi kích thước mẫu càng
lớn.
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
6
Mối quan hệ giữa n và sai số
trong chọn mẫu
Sai số do
chọn mẫu SE
Sai số KHÔNG do
chọn mẫu NE
n N
Tăngkíchthướcmẫu
Sai số do
chọn mẫu SE
Sai số KHÔNG do
chọn mẫu NE
Sai số do
chọn mẫu SE
Sai số KHÔNG do
chọn mẫu NE
SE 0
Sai số KHÔNG do
chọn mẫu NE
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
3. 3
7
Qui trình chọn mẫu
1. Xác định đám đông nghiên cứu
2. Xác định khung mẫu
3. Xác định kích thước mẫu
4. Chọn phương pháp chọn mẫu
5. Tiến hành chọn
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
8
Qui trình chọn mẫu
1. Xác định đám đông nghiên cứu
2. Xác định khung mẫu
3. Xác định kích thước mẫu
4. Chọn phương pháp chọn mẫu
5. Tiến hành chọn
• Là khâu đầu tiên của quá
trình chọn mẫu
• Được tiến hành khi thiết kế
nghiên cứu
Xác định nguồn dữ liệu,
đối tượng thu thập dữ liệu
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
9
Qui trình chọn mẫu
1. Xác định đám đông nghiên cứu
2. Xác định khung mẫu
3. Xác định kích thước mẫu
4. Chọn phương pháp chọn mẫu
5. Tiến hành chọn
• Là danh sách liệt kê tất cả
các đối tượng NC của đám
đông
• Thường khó xác định chính
xác khung mẫu
Dựa trên số liệu thứ cấp
và suy đoán/dự báo
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
4. 4
10
Qui trình chọn mẫu
1. Xác định đám đông nghiên cứu
2. Xác định khung mẫu
3. Xác định kích thước mẫu
4. Chọn phương pháp chọn mẫu
5. Tiến hành chọn
• Kích thước mẫu phụ thuộc
vào phương pháp xử lý/phân
tích số liệu
• Kích thước mẫu càng lớn
thì càng tốt nhưng tốn chi phí
và thời gian
• Một số công thức xác định
kích thước mẫu Slide sau
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
11
Xác định kích thước mẫu theo
qui luật phỏng đoán
Số mẫu tối thiểu là 30 mẫu thì giá trị thống kê
có ý nghĩa
Ví dụ: Nếu khảo sát mức chi tiêu tiền điện thoại di
động cho 5 nhóm thu nhập và 5 nhóm tuổi thì sẽ
có 5 x 5 ô trong bảng.
Kích thước mẫu là n = 5 x 5 x 30 = 750
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
12
Trong đó ε là sai số cho phép và P là độ tin cậy
P
ε
0,85 0,90 0,95
0,05 207 270 384
0,04 323 422 600
0,03 375 755 1967
…. … … ….
0,01 5180 6764 9603
Nguồn: Nguyễn Thị Cành, 2004, Trang 82-84
Xác định kích thước mẫu theo
bảng thống kê
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
5. 5
13
Xác định kích thước mẫu theo công thức
n = N.Z2.p.q/(N.ε2 + N2.p.q)
Với
N là tổng thể, n là mẫu
p = n1/N là tỉ lệ mẫu dự kiến, q = 1 – p
Z là giá trị biến thiên chuẩn tương ứng với độ tin cậy P
(được tính sẵn)
ε là sai số cho phép
Ví dụ: Xác định kích thước mẫu trong điều tra mức sống
dân cư tại một huyện có 25000 hộ dân, với sai số cho
phép là 1% và độ tin cậy 95%.
n =?
thay đổi các thông số p, q, ε n thay đổi như thế nào
Nguồn: Nguyễn Thị Cành, 2004, Trang 82-84
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
14
Xác định kích thước mẫu theo công thức
Với
N là tổng thể, n là mẫu
p = n1/N là tỉ lệ mẫu dự kiến, q = 1 – p
Z là giá trị biến thiên chuẩn tương ứng với độ tin cậy P
(được tính sẵn)
ε là sai số cho phép
Ví dụ: Xác định kích thước mẫu trong điều tra mức sống
dân cư tại một huyện có 25000 hộ dân, với sai số cho phép
là 1% và độ tin cậy 95%.
n =?
thay đổi các thông số p, q, ε n thay đổi như thế nào
n = Z2.p.q/ε2
Nguồn: Nguyễn Thị Cành, 2004, Trang 82-84
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
15
Xác định kích thước mẫu
bằng công thức Slovin
n = N/(1+N.ε2)
Với
N là tổng thể, n là mẫu
ε là sai số cho phép
Ví dụ: Xác định kích thước mẫu trong điều tra mức
sống dân cư tại một huyện có 25000 hộ dân, với
sai số cho phép là 5%.
n =?
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
6. 6
16
Xác định kích thước mẫu trong MLR
(Multiple Linear Regression)
Chọn kích thước mẫu trong MLR phụ thuộc vào nhiều
yếu tố:
Mức ý nghĩa (signigicant level)
Độ mạnh của phép kiểm định (power of the test)
Số lượng biến độc lập
Công thức kinh nghiệm:
n ≥ 50 + 8p
Với n là kích thước mẫu tối thiểu cần thiết
p số biến độc lập trong mô hình
Nguồn: Nguyễn Đình Thọ, 2011, Trang 499-500.
KHOA KINH TẾ - QTKD ĐẠI HỌC CẦN THƠ
17
Qui trình chọn mẫu
1. Xác định đám đông nghiên cứu
2. Xác định khung mẫu
3. Xác định kích thước mẫu
4. Chọn phương pháp chọn mẫu
5. Tiến hành chọn
• gồm
• 1) chọn mẫu xác suất
(propapility sampling) và
• 2) chọn mẫu không theo
xác suất/phi xác suất
(non-propability sampling)
18
Phương pháp chọn mẫu xác
suất
1. Chọn mẫu xác suất (Propability sampling): Dựa vào lý
thuyết xác suất để lấy mẫu ngẫu nhiên
Một số cách chọn mẫu xác suất
Chọn mẫu ngẫu nhiên đơn giản (Simple random
sampling)
Chọn mẫu có hệ thống (Systematic sampling)
Chọn mẫu ngẫu nhiên phân tầng (Stratified sampling)
Chọn mẫu theo nhóm/khối (Cluster sampling)
7. 7
19
Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu ngẫu nhiên đơn giản: Là cách chọn mẫu mà
mỗi phần tử trong tổng thể có cùng cơ hội được chọn với
xác suất như nhau. Để chọn được mẫu, người nghiên cứu
phải có danh sách tổng thể nghiên cứu
Ví dụ: Ta muốn chọn một mẫu có kích thước mẫu là n =200
từ một tổng thể là N = 2000.
Ta sử dụng bảng ngẫu nhiên hoặc sử dụng lệnh ngẫu
nhiên ngẫu nhiên trong Excel Rand()
Rand()*2000, sau đó copy lệnh RAND thêm 199 lần nữa.
20
Chọn mẫu có hệ thống
Chọn mẫu có hệ thống: Là cách chọn mẫu mà mẫu đầu
tiên là ngẫu nhiên, sau đó cứ cách k đơn vị ta lại chọn một
phần tử. Với k = N/n ( N: độ lớn tổng thể và n kích thước
mẫu)
Ví dụ: Như ví dụ chọn mẫu ngẫu nhiên đơn giản, danh sách
2.000 phần tử có có sẵn trên máy tính, ta sẽ sử dụng cách
chọn mẫu hệ thống. Tính k = 2.000/200 = 10. Ta sẽ gieo số
ngẫu nhiên trong khoảng 1 đến 10. Ví dụ được số 8. Mẫu
được chọn là 8. Các mẫu tiếp theo sẽ là 8 +10 = 18, 18 + 10
= 28, … đến khi được 200 phần tử
21
Chọn mẫu ngẫu nhiên phân tầng
Chọn mẫu ngẫu nhiên phân tầng (stratified
sampling): Là phân chia các đối tượng nghiên cứu thành
các nhóm, tầng theo các đặc tính, sau đó lấy mẫu theo
tầng, nhóm. Nguyên tắc phân nhóm là cùng nhóm đồng
nhất (homgeneity), khác nhóm dị biệt (deterogeneity).
Ví dụ: Ta muốn chọn một mẫu có kích cỡ mẫu là n =200 từ
một tổng thể là N = 2000. Ta chia tổng thể ra thành 4 nhóm
với kích thước của từng nhóm là 700, 400, 300 và 600. Ta
sẽ chọn mẫu theo tỉ lệ của 4 nhóm trên hoặc không theo tỉ
lệ (ý kiến chủ quan của nhà nghiên cứu).
4 nhóm trên có đặc điểm khác nhau nhưng các phần tử
của từng nhóm tương đối đồng nhất với nhau.
8. 8
22
Chọn mẫu theo nhóm
Chọn mẫu theo nhóm (Cluster sampling): Là phân chia
các đối tượng nghiên cứu thành các nhóm (cluster) như
phương pháp phân tầng. Tuy nhiên, các nhóm này có đặc
điểm là các phần tử trong cùng một nhóm có tính khác
biệt/biệt dị cao và các phần tử giữa các nhóm có tính đồng
nhất cao ngược với phương pháp phân nhóm trong chọn
mẫu ngẫu nhiên phân tầng.
Ví dụ: Ta muốn chọn một mẫu có kích cỡ mẫu là n =200 từ
một tổng thể là N = 2000. Ta chia tổng thể ra thành 4 nhóm
với kích thước của từng nhóm là 700, 400, 300 và 600. Ta sẽ
chọn 2 nhóm để lấy mẫu (400 và 600). Ta chọn phương pháp
ngẫu nhiên hoặc hệ thống để lấy 200 phần tử từ 2 nhóm này.
4 nhóm trên có đặc điểm giống nhau nhưng các phần tử
của từng nhóm tương đối khác biệt với nhau.
23
Phương pháp chọn mẫu phi xác suất
2. Chọn mẫu phi xác suất: Chọn theo ý định chủ quan của
người nghiên cứu
Một số cách chọn mẫu phi xác suất
Chọn mẫu thuận tiện (Convenience, Haphazard or
accdental sampling)
Chọn mẫu phán đoán (Judgmental sampling or
Purposive sampling)
Chọn mẫu chỉ định/định mức (ad hoc quota
sampling)
Chọn mẫu theo mạng quan hệ/phát triển mầm
(snowball sampling)
24
Chọn mẫu thuận tiện: Các đơn vị mẫu được chọn ở tại
một địa điểm và vào một thời gian nhất định
Ví dụ: Chọn mẫu những người đi mua sắm ở siêu thị METRO
Cần Thơ và tiếp cận họ khi họ bước vào siêu thị hoặc khi họ
vừa mua sắm món hàng mà ta muốn khảo sát
Cách chọn mẫu này là không ngẫu nhiên vì không phải tất cả
mọi người dân Cần Thơ đều có xác suất như nhau để được
chọn vào mẫu
Ưu điểm
Dễ dàng để tập hợp các đơn vị mẫu
Nhược điểm
Không đạt được độ xác thực cao
Chọn mẫu thuận tiện
9. 9
25
Chọn mẫu phán đoán: Các đơn vị mẫu được chọn
dựa vào sự phán đoán của người nghiên cứu mà họ
nghĩ rằng những mẫu này có thể đại diện cho tổng thể
Ví dụ: Chọn mẫu một số ít liên doanh lớn có thể chiếm
phần lớn tổng sản lượng ngành công nghiệp cả nước
Cách chọn mẫu này được dùng phổ biến khi nghiên cứu
định tính (nghiên cứu khách hàng công nghiệp hay kênh
phân phối)
Ưu điểm
Chọn được đúng một số phần tử rất quan trọng của
tổng thể vào trong mẫu
Nhược điểm
Có khả năng phát sinh những sai lệch lớn
Chọn mẫu phán đoán
26
Chọn mẫu chỉ định/định mức: Là chọn mẫu theo tỷ lệ
gần đúng của các nhóm đại diện trong tổng thể hoặc theo
số mẫu được chỉ định cho mỗi nhóm
Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát
để so sánh kết quả thống kê về thái độ khách hàng. Hoặc
tổng thể nghiên cứu bao gồm 1.000 công ty, trong đó 600
công ty vừa và nhỏ, 300 trung bình và 100 qui mô lớn. Số
mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 công ty
vừa và nhỏ, 30 trung bình và 10 công ty lớn.
Ưu điểm
Đảm bảo được số mẫu cần thiết cho từng nhóm trong
tổng thể phục vụ cho phân tích
Nhược điểm
Có thể cho kết quả sai lệch
Chọn mẫu chỉ định/định mức
27
Chọn mẫu theo mạng quan hệ/
phát triển mầm
Ưu điểm
Giúp cho người nghiên cứu chọn được các mẫu mà họ cần
nghiên cứu
Chọn mẫu theo mạng quan hệ/phát triển mầm: Người
nghiên cứu sẽ thông qua người trả lời đầu tiên để tiếp cận
những người trả lời kế tiếp
Ví dụ: Phỏng vấn An, khoảng gần kết thúc phỏng vấn có thể
đề nghị An giới thiệu một hoặc hai người nữa có thể am
hiểu về chủ đề khảo sát
AnAn
BìnhBình
TínTín
LinhLinh
BíchBích
CôngCông
10. 10
28
Tìm hiểu thêm
Ưu và nhược điểm của phương pháp chọn mẫu xác
suất và phi xác suất
Ưu và nhược điểm, phạm vi áp dụng và các lưu ý khi sử
dụng
Phương pháp chọn mẫu xác suất
Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu có hệ thống
Chọn mẫu ngẫu nhiên phân tầng
Chọn mẫu theo nhóm
Phương pháp chọn mẫu phi xác suất.
Chọn mẫu thuận tiện
Chọn mẫu phán đoán
Chọn mẫu định mức
Chọn mẫu theo mạng quan hệ
29
Qui trình chọn mẫu
1. Xác định đám đông nghiên cứu
2. Xác định khung mẫu
3. Xác định kích thước mẫu
4. Chọn phương pháp chọn mẫu
5. Tiến hành chọn Chọn mẫu