SlideShare ist ein Scribd-Unternehmen logo
1 von 37
CHƯƠNG II
Làm sạch dữ liệu
Lecturer: Nguyễn Văn Phú
MỤC TIÊU
• Kiến thức:
• Kiểm tra dữ liệu nhập vào và dùng phần mềm SPSS để làm sạch dữ liệu trước khi tiến hành
phân tích dữ liệu.
• Làm được các bước cơ bản như tìm, sửa dữ liệu nhập sai, sắp xếp dữ liệu, tách nối file dữ
liệu trong SPSS.
• Kỹ năng
• Mã hóa lại các biến trong phân tích dữ liệu như mã hóa lại biến từ thang đo định lượng
sang thang đo định danh, mã hóa dữ liệu từ câu hỏi mở sang câu hỏi đóng.
NỘI DUNG
• 2.1. Mã hóa dữ liệu
• 2.2 Lý do làm sạch dữ liệu
• 2.3 Các biện pháp ngăn ngừa
• 2.4 Các phương pháp làm sạch dữ liệu
• 2.5. Tách nối file
2.1. Mã hóa dữ liệu
• Mã hóa dữ liệu làm tăng độ tin cậy, tính nhất quán.
• Chỉ mã hóa dữ liệu cho thang đo danh nghĩa/thứ bậc.
• Có thể mã hóa LẠI dữ liệu định lượng -> dữ liệu định tính(thang đo thứ bậc).
• có 2 hình thức mã hóa
• Mã hóa trước
• Mã hóa sau
Mã hóa trước
• Mã hóa trước khi nhập liệu
Mã hóa sau
• Mục đích của mã hóa sau là làm tăng chất lượng của mẫu.
• Mã hóa lại các giá trị của biến.
• Mã hóa giá trị khuyết.
• Mã hóa tự động các giá của biến định lượng (rời rạc) -> định tính (thứ bậc)
Mã hóa lại các giá trị của biến
• Tính toán khoảng chia phù hợp.
• Thống kê
• Thực hiện mã hóa:
• Cách 1. Transform -> Recode into same variable
• Cách 2. Transform -> Recode into different variable
Cách 1. Transform -> Recode into same variable
Old and New Value
Cách 1. Transform -> Recode into same variable
Mã hóa các giá trị của biến định lượng
(liên tục) -> định tính (thứ bậc).
Cách 2. Transform -> Recode into different variable
Old and New Value
Mã hóa tự động
• Mã hóa tự động các giá trị của biến định lượng (rời rạc) -> định tính (thứ bậc).
• Transform -> Automatic Recode
2.2 Lý do làm sạch dữ liệu
• Nguyên nhân lỗi dữ liệu:
• Nhập liệu
• Lỗi thiết bị
• Chất lượng phỏng vấn
• Trả lời không nhất quán
• …
• Làm sạch dữ liệu:
• Đảm bảo tính đúng của dữ liệu
• Đảm bảo độ tin cậy
• Đảm bảo sự nhất quán
2.3 Các biện pháp ngăn ngừa
• Xây dựng nội dung điều tra khảo sát rõ rang, dễ hiểu, tránh nhập nhằng
• Thiết bị đo lường phải chính xác
• Đào tạo, huấn luyện đội ngũ phỏng vấn viên
• Nhập liệu cẩn thận, chính xác
2.4 Các phương pháp làm sạch dữ liệu
• Dùng Value label để phát hiện các giá trị sai của biến có thang đo danh nghĩa
hoặc thứ bậc.
• Dùng bảng tần số.
• Dùng đồ thị RÂU (Boxlot)
• Dùng bảng chéo.
• Dùng Select case.
• Cách tìm và sửa dữ liệu nhập sai.
Dùng Value label
• Dùng Value label để phát hiện các giá trị sai của biến có thang đo danh nghĩa
hoặc thứ bậc
• VALUES LABEL phát hiện các giá trị chưa gán nhãn
VALUES
LABEL
Giá
trị
sai
Dùng Value label
• Ưu điểm
• Đơn giản, dễ sử dụng, dễ phát hiện lỗi
• Nhược điểm
• Không biết được số lượng lỗi
• Phải duyệt từng trang màn hình để tìm lỗi
Dùng bảng tần số
• Analyze -> Descriptive Statistics -> Frequencies.
Chọn biến từ DS
-> Variables
Dùng bảng tần số
Dùng bảng tần số
• Ưu điểm
• Đơn giản, dễ sử dụng
• Biết được các lỗi và số lượng của chúng
• Nhược điểm
• Chỉ tìm được lỗi trên từng biến
• Không phát hiện được lỗi kết hợp
Dùng đồ thị RÂU (Boxlot)
• Để phát hiện các giá trị bất thường
• Ưu điểm
• Dùng tốt cho biến định lượng
• Cho biết vị trí của giá trị bất thường trong Data file
• Nhược điểm
• Chỉ áp dụng cho tường biến, không có khả năng kết hợp
Dùng đồ thị RÂU (Boxlot)
Dùng bảng chéo
• Analyze -> Descriptive Statistics -> CrossTab
Dùng bảng chéo
• Dò từng cặp để phát hiên lỗi
Dùng bảng chéo
• Ưu điểm
• Phát hiện lỗi kết hợp
• Nhược điểm
• Không áp dụng được cho trường hợp có điều kiện phức tạp
SỬ DỤNG SELECT CASE
• BẢNG SỰ THẬT (CHÂN TRỊ)
SỬ DỤNG SELECT CASE
• Sử dụng hàm ANY() để phát hiện lỗi không nhất quán. Cú pháp:
• ANY(Test,Values_List)
• Trong đó:
• Test: Giá trị cần kiểm tra
• Values_List: Có 1 hoặc nhiều giá trị. Đây là danh sách đối chiếu với Test.
• Hàm ANY() trả về 1 trong 3 giá trị:
• =1 nếu Test trùng với 1 giá trị trong Values_List
• =0 nếu Test không trùng với 1 giá trị trong Values_List
• = . (Missing) nếu Test là Missing
SELECT CASE
• Data -> Select case -> if codition is satisfield -> if
SELECT CASE
• Data -> Select case -> if codition is satisfield -> if
Cách tìm và sửa dữ liệu nhập sai.
• Tìm các giá trị lỗi
• Dùng lệnh find
• Sort case
• Dùng các biểu thức logic
Cách tìm và sửa dữ liệu nhập sai.
• Dùng lệnh find. Trước khi dùng:
• Chọn cột biến cần kiểm tra
• Tắt chế độ Value Label
• Gọi lệnh FIND:
• EDIT => FIND
• Ctrl + F
Nhập giá trị tìm kiếm
Đánh dấu V cho Replace
Nhập giá trị thay thế
Cách tìm và sửa dữ liệu nhập sai.
• Dùng lệnh find. Nếu không tắt chế độ Value Label.
Không thể thay thế
Cách tìm và sửa dữ liệu nhập sai.
• Sort case
• Data => Sort case
Cách tìm và sửa dữ liệu nhập sai.
• Dùng các biểu thức logic
• Ví dụ: tìm những người có nghề giáo viên và tuổi =18
• (nghe=2)&(tuoi=18):
2.5. Tách, nối file dữ liệu
• Nối file dữ liệu
Nguồn A Nguồn B
Trộn A&B
2.5. Tách, nối file dữ liệu
• Nối file dữ liệu
• Mở file dữ liệu đích (Destination file)
• Data => Merge file => Add Case
Mở file dữ liệu nguồn (DataSoure file)
Tổng kết

Weitere ähnliche Inhalte

Kürzlich hochgeladen

bài tập trắc nghiệm cho sinh viên. (1)doc.doc
bài tập trắc nghiệm cho sinh viên. (1)doc.docbài tập trắc nghiệm cho sinh viên. (1)doc.doc
bài tập trắc nghiệm cho sinh viên. (1)doc.docLeHoaiDuyen
 
Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...
Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...
Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...Học viện Kstudy
 
Chương 7 Chủ nghĩa xã hội khoa học neu slide
Chương 7 Chủ nghĩa xã hội khoa học neu slideChương 7 Chủ nghĩa xã hội khoa học neu slide
Chương 7 Chủ nghĩa xã hội khoa học neu slideKiuTrang523831
 
Báo cáo thực tập môn logistics và quản lý chuỗi cung ứng
Báo cáo thực tập môn logistics và quản lý chuỗi cung ứngBáo cáo thực tập môn logistics và quản lý chuỗi cung ứng
Báo cáo thực tập môn logistics và quản lý chuỗi cung ứngngtrungkien12
 
Tạp dề ngắn phục vụ cho nhà hàng, quán cafe
Tạp dề ngắn phục vụ cho nhà hàng, quán cafeTạp dề ngắn phục vụ cho nhà hàng, quán cafe
Tạp dề ngắn phục vụ cho nhà hàng, quán cafeMay Ong Vang
 

Kürzlich hochgeladen (6)

bài tập trắc nghiệm cho sinh viên. (1)doc.doc
bài tập trắc nghiệm cho sinh viên. (1)doc.docbài tập trắc nghiệm cho sinh viên. (1)doc.doc
bài tập trắc nghiệm cho sinh viên. (1)doc.doc
 
Căn hộ Aio City Bình Tân - Tập đoàn Hoa Lâm.pdf
Căn hộ Aio City Bình Tân - Tập đoàn Hoa Lâm.pdfCăn hộ Aio City Bình Tân - Tập đoàn Hoa Lâm.pdf
Căn hộ Aio City Bình Tân - Tập đoàn Hoa Lâm.pdf
 
Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...
Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...
Enter Digital - Ứng dụng Digital Marketing trong nhà hàng Nhật Bản - Minh Anh...
 
Chương 7 Chủ nghĩa xã hội khoa học neu slide
Chương 7 Chủ nghĩa xã hội khoa học neu slideChương 7 Chủ nghĩa xã hội khoa học neu slide
Chương 7 Chủ nghĩa xã hội khoa học neu slide
 
Báo cáo thực tập môn logistics và quản lý chuỗi cung ứng
Báo cáo thực tập môn logistics và quản lý chuỗi cung ứngBáo cáo thực tập môn logistics và quản lý chuỗi cung ứng
Báo cáo thực tập môn logistics và quản lý chuỗi cung ứng
 
Tạp dề ngắn phục vụ cho nhà hàng, quán cafe
Tạp dề ngắn phục vụ cho nhà hàng, quán cafeTạp dề ngắn phục vụ cho nhà hàng, quán cafe
Tạp dề ngắn phục vụ cho nhà hàng, quán cafe
 

Empfohlen

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Empfohlen (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Chương 2. Làm sạch dữ liệu.pptx

  • 1. CHƯƠNG II Làm sạch dữ liệu Lecturer: Nguyễn Văn Phú
  • 2. MỤC TIÊU • Kiến thức: • Kiểm tra dữ liệu nhập vào và dùng phần mềm SPSS để làm sạch dữ liệu trước khi tiến hành phân tích dữ liệu. • Làm được các bước cơ bản như tìm, sửa dữ liệu nhập sai, sắp xếp dữ liệu, tách nối file dữ liệu trong SPSS. • Kỹ năng • Mã hóa lại các biến trong phân tích dữ liệu như mã hóa lại biến từ thang đo định lượng sang thang đo định danh, mã hóa dữ liệu từ câu hỏi mở sang câu hỏi đóng.
  • 3. NỘI DUNG • 2.1. Mã hóa dữ liệu • 2.2 Lý do làm sạch dữ liệu • 2.3 Các biện pháp ngăn ngừa • 2.4 Các phương pháp làm sạch dữ liệu • 2.5. Tách nối file
  • 4. 2.1. Mã hóa dữ liệu • Mã hóa dữ liệu làm tăng độ tin cậy, tính nhất quán. • Chỉ mã hóa dữ liệu cho thang đo danh nghĩa/thứ bậc. • Có thể mã hóa LẠI dữ liệu định lượng -> dữ liệu định tính(thang đo thứ bậc). • có 2 hình thức mã hóa • Mã hóa trước • Mã hóa sau
  • 5. Mã hóa trước • Mã hóa trước khi nhập liệu
  • 6. Mã hóa sau • Mục đích của mã hóa sau là làm tăng chất lượng của mẫu. • Mã hóa lại các giá trị của biến. • Mã hóa giá trị khuyết. • Mã hóa tự động các giá của biến định lượng (rời rạc) -> định tính (thứ bậc)
  • 7. Mã hóa lại các giá trị của biến • Tính toán khoảng chia phù hợp. • Thống kê • Thực hiện mã hóa: • Cách 1. Transform -> Recode into same variable • Cách 2. Transform -> Recode into different variable
  • 8. Cách 1. Transform -> Recode into same variable Old and New Value
  • 9. Cách 1. Transform -> Recode into same variable Mã hóa các giá trị của biến định lượng (liên tục) -> định tính (thứ bậc).
  • 10. Cách 2. Transform -> Recode into different variable Old and New Value
  • 11. Mã hóa tự động • Mã hóa tự động các giá trị của biến định lượng (rời rạc) -> định tính (thứ bậc). • Transform -> Automatic Recode
  • 12. 2.2 Lý do làm sạch dữ liệu • Nguyên nhân lỗi dữ liệu: • Nhập liệu • Lỗi thiết bị • Chất lượng phỏng vấn • Trả lời không nhất quán • … • Làm sạch dữ liệu: • Đảm bảo tính đúng của dữ liệu • Đảm bảo độ tin cậy • Đảm bảo sự nhất quán
  • 13.
  • 14. 2.3 Các biện pháp ngăn ngừa • Xây dựng nội dung điều tra khảo sát rõ rang, dễ hiểu, tránh nhập nhằng • Thiết bị đo lường phải chính xác • Đào tạo, huấn luyện đội ngũ phỏng vấn viên • Nhập liệu cẩn thận, chính xác
  • 15. 2.4 Các phương pháp làm sạch dữ liệu • Dùng Value label để phát hiện các giá trị sai của biến có thang đo danh nghĩa hoặc thứ bậc. • Dùng bảng tần số. • Dùng đồ thị RÂU (Boxlot) • Dùng bảng chéo. • Dùng Select case. • Cách tìm và sửa dữ liệu nhập sai.
  • 16. Dùng Value label • Dùng Value label để phát hiện các giá trị sai của biến có thang đo danh nghĩa hoặc thứ bậc • VALUES LABEL phát hiện các giá trị chưa gán nhãn VALUES LABEL Giá trị sai
  • 17. Dùng Value label • Ưu điểm • Đơn giản, dễ sử dụng, dễ phát hiện lỗi • Nhược điểm • Không biết được số lượng lỗi • Phải duyệt từng trang màn hình để tìm lỗi
  • 18. Dùng bảng tần số • Analyze -> Descriptive Statistics -> Frequencies. Chọn biến từ DS -> Variables
  • 20. Dùng bảng tần số • Ưu điểm • Đơn giản, dễ sử dụng • Biết được các lỗi và số lượng của chúng • Nhược điểm • Chỉ tìm được lỗi trên từng biến • Không phát hiện được lỗi kết hợp
  • 21. Dùng đồ thị RÂU (Boxlot) • Để phát hiện các giá trị bất thường • Ưu điểm • Dùng tốt cho biến định lượng • Cho biết vị trí của giá trị bất thường trong Data file • Nhược điểm • Chỉ áp dụng cho tường biến, không có khả năng kết hợp
  • 22. Dùng đồ thị RÂU (Boxlot)
  • 23. Dùng bảng chéo • Analyze -> Descriptive Statistics -> CrossTab
  • 24. Dùng bảng chéo • Dò từng cặp để phát hiên lỗi
  • 25. Dùng bảng chéo • Ưu điểm • Phát hiện lỗi kết hợp • Nhược điểm • Không áp dụng được cho trường hợp có điều kiện phức tạp
  • 26. SỬ DỤNG SELECT CASE • BẢNG SỰ THẬT (CHÂN TRỊ)
  • 27. SỬ DỤNG SELECT CASE • Sử dụng hàm ANY() để phát hiện lỗi không nhất quán. Cú pháp: • ANY(Test,Values_List) • Trong đó: • Test: Giá trị cần kiểm tra • Values_List: Có 1 hoặc nhiều giá trị. Đây là danh sách đối chiếu với Test. • Hàm ANY() trả về 1 trong 3 giá trị: • =1 nếu Test trùng với 1 giá trị trong Values_List • =0 nếu Test không trùng với 1 giá trị trong Values_List • = . (Missing) nếu Test là Missing
  • 28. SELECT CASE • Data -> Select case -> if codition is satisfield -> if
  • 29. SELECT CASE • Data -> Select case -> if codition is satisfield -> if
  • 30. Cách tìm và sửa dữ liệu nhập sai. • Tìm các giá trị lỗi • Dùng lệnh find • Sort case • Dùng các biểu thức logic
  • 31. Cách tìm và sửa dữ liệu nhập sai. • Dùng lệnh find. Trước khi dùng: • Chọn cột biến cần kiểm tra • Tắt chế độ Value Label • Gọi lệnh FIND: • EDIT => FIND • Ctrl + F Nhập giá trị tìm kiếm Đánh dấu V cho Replace Nhập giá trị thay thế
  • 32. Cách tìm và sửa dữ liệu nhập sai. • Dùng lệnh find. Nếu không tắt chế độ Value Label. Không thể thay thế
  • 33. Cách tìm và sửa dữ liệu nhập sai. • Sort case • Data => Sort case
  • 34. Cách tìm và sửa dữ liệu nhập sai. • Dùng các biểu thức logic • Ví dụ: tìm những người có nghề giáo viên và tuổi =18 • (nghe=2)&(tuoi=18):
  • 35. 2.5. Tách, nối file dữ liệu • Nối file dữ liệu Nguồn A Nguồn B Trộn A&B
  • 36. 2.5. Tách, nối file dữ liệu • Nối file dữ liệu • Mở file dữ liệu đích (Destination file) • Data => Merge file => Add Case Mở file dữ liệu nguồn (DataSoure file)