SlideShare ist ein Scribd-Unternehmen logo
1 von 25
Oleh:
Fraschiska Rizky R
06211540000022
Dosen Pengampu:
Dr. Dra. Kartika Fithriasari, M.Si
Novri Suhermi, S.Si, M.Sc
Kelas Data Mining A
2018
Perbandingan Klasifikasi Data NBA Rookies dengan Menggunakan Decision
Tree, Random Forest, Gradient Boosting, Adaptive Boosting, Multilayer
Perceptron, K-Nearest Neighbor, Naive Bayes dan Logistic Regression
1
2
Outline
01
03
PENDAHULUAN
ANALISIS DAN PEMBAHASAN
02 METODOLOGI PENELITIAN
04 KESIMPULAN DAN SARAN
3
PENDAHULUAN
4
NBA Rookie
“Basket tidak hanya bersifat
sebagai sebuah permainan biasa,
akan tetapi berubah menjadi
sebuah permainan profesional “
Statistik pemain dalam setiap
pertandingan sangat penting
Klasifikasi Pemain NBA Rookie
dengan Decision Tree, Random Forest, Gradient
Boosting, Adaptive Boosting, Multilayer
Perceptron, K-Nearest Neighbor, Naive Bayes
dan Logistic Regression
5
METODOLOGI PENELITIAN
6
Data sekunder : Data NBA Rookies sebanyak 1340
data yang diperoleh dari Data World diakses
tanggal 5 Desember 2018 pukul 19.00. Data terdiri
dari dua kelas dengan kelas 0 berjumlah 509 data
dan kelas 1 berjumlah 831 data
Sumber Data
7
VARIABEL PENELITIAN
No Variabel Keterangan Jenis Variabel
1. Nama Nama pemain rookie Independen
2. GP
Jumlah pertandingan yang telah dialami pemain dalam 1 musim
kompetisi
Independen
3. MIN Durasi waktu pemain bermain selama pertandingan. Independen
4. PTS Skor yang diperoleh untuk setiap kali bertanding Independen
5. FGM Poin yang dicetak pemain selama pertandingan Independen
6. FGA Peluang dalam mencetak poin selama pertandingan Independen
7. FG%
Persentase keberhasilan seorang pemain untuk mencetak poin
selama pertandingan
Independen
8. 3P Made
Poin yang dicetak pemain melalui tembakan 3 angka selama
pertandingan
Independen
9. 3PA
Peluang dalam mencetak poin melalui tembakan 3 angka selama
pertandingan
Independen
10. 3P%
Persentase keberhasilan seorang pemain untuk mencetak poin
melalui tembakan 3 angka selama pertandingan
Independen
11. FTM
Tembakan bebas atau tembakan hukuman yang dapat dieskekusi
pemain selama pertandingan
Independen
12. FTA
Peluang seorang pemain mengeksekusi tembakan bebas atau
tembakan hukuman selama pertandingan
Independen
8
VARIABEL PENELITIAN
No Variabel Keterangan Jenis Variabel
13. FT%
Persentase keberhasilan seorang pemain dalam mengeksekusi
tembakan bebas atau tembakan hukuman selama pertandingan
Independen
14. OREB
Perolehan bola netral atau bola mentah
hasil tembakan tim serang pada saat
posisi menyerang selama pertandingan
Independen
15. DREB
Perolehan bola netral atau bola mentah
hasil tembakan tim serang pada saat
posisi menyerang selama pertandingan
Independen
16. REB
Jumlah perolehan bola netral atau bola mentah
selama pertandingan
Independen
17. AST
Hasil passing atau operan bola yang membuahkan poin dalam
pertandingan
Independen
18. STL Pencurian bola dari tangan tim lawan dalam pertandingan Independen
19. BLK
Hasil menggagalkan tembakan pemain dari tim lawan dalam
pertandingan
Independen
20. TOV Kesalahan yang dilakukan pemain selama pertandingan Independen
21. TARGET_5Yrs
Karir pemain rookie
0 : karir kurang dari 5 tahun
1 : karir lebih dari atau sama dengan 5 tahun
Dependen
9
STRUKTUR DATA
No X1 X2 X3 … Xj … XM
1 X11 X12 X13 … X1j … X1M
2 X21 X22 X23 … X2j … X2M
3 X31 X32 X33 … X3j … X3M
⁞ ⁞ ⁞ ⁞ … ⁞ ⁞ ⁞
i Xi1 Xi2 Xi3 … Xij … XiM
⁞ … …
N XN1 XN2 XN3 … XNj … XNM
10
1
2 4
5
Pengumpulan
data
Pre-processing
data
Eksplorasi
data
Klasifikasi
7
Penarikan
Kesimpulan dan
Saran
3
Feature
engineering &
feature
selection
6
Hyperparameter
Tuning
11
ANALISIS DAN PEMBAHASAN
12
Deteksi Missing Value
Deteksi Data Duplikat
13
Eksplorasi Data
14
Eksplorasi Data
15
Eksplorasi Data
16
Feature
Engineering
data['GP-MIN']= data['GP'] * data['MIN']
data['GP-PTS']= data['GP'] * data['PTS']
Feature
Selection
Variabel terpilih :
GP
MIN
FGA
FG%
3P%
FTM
FT%
OREB
DREB
GP-MIN
GP-PTS
17
Normalisasi Data
0 1 2 .... 8 9 10
0 0.035086 0.026704 0.007407 .... 0.003314 0.961352 0.259635
1 0.035736 0.027466 0.006841 .... 0.002042 0.961309 0.257302
2 0.061612 0.012739 0.003913 .... 0.001415 0.942666 0.320383
3 0.076651 0.01533 0.007269 .... 0.001189 0.889151 0.43691
4 0.079878 0.019137 0.004992 .... 0.002496 0.918599 0.359452
Principal Component Analysis (PCA)
0 1
0 -0.006766 -0.09617
1 0.000044 -0.09585
2 -0.032776 -0.03974
3 -0.035078 0.095691
4 0.017843 0.026243
18
Klasifikasi
Hold Out Method
Metode
Akurasi
Sebelum
Hyperparameter tuning
Sesudah
Hyperparameter tuning
Decision tree 0.588345865 0.70112782
Random Forest 0.65037594 0.714285714
Gradient Boosting 0.657894737 0.697368421
AdaBoost 0.659774436 0.714285714
MLP 0.712406015 0.678571429
KNN 0.661654135 0.712406015
Naive Bayes 0.686090226 0.686090226
Logistic Regression 0.654135338 0.72556391
19
Klasifikasi
CV - KFold
Metode
Akurasi
Sebelum
Hyperparameter tuning
Sesudah
Hyperparameter tuning
Decision tree 0.6024 0.687473
Random Forest 0.640792 0.684455
Gradient Boosting 0.66492 0.677693
AdaBoost 0.660377 0.673931
MLP 0.685243 0.684477
KNN 0.663419 0.685221
Naive Bayes 0.670189 0.670189
Logistic Regression 0.655897 0.694257
20
Klasifikasi
CV – Stratified KFold
Metode
Akurasi
Sebelum
Hyperparameter tuning
Sesudah
Hyperparameter tuning
Decision tree 0.579807 0.675427
Random Forest 0.626447 0.684438
Gradient Boosting 0.661876 0.685919
AdaBoost 0.669355 0.678423
MLP 0.683681 0.6822
KNN 0.66264 0.688209
Naive Bayes 0.667134 0.667134
Logistic Regression 0.659604 0.694241
21
Perbandingan Hold Out Method
dan Cross Validation
Metode Hold Out KFold Stratified KFold
Decision tree 0.70112782 0.687473 0.675427
Random Forest 0.714285714 0.684455 0.684438
Gradient
Boosting
0.697368421 0.677693 0.685919
AdaBoost 0.714285714 0.673931 0.678423
MLP 0.678571429 0.684477 0.6822
KNN 0.712406015 0.685221 0.688209
Naive Bayes 0.686090226 0.670189 0.667134
Logistic
Regression
0.72556391 0.694257 0.694241
22
KESIMPULAN DAN SARAN
23
Kesimpulan
• Terdapat missing value pada variabel 3P%
• Terdapat data duplikat sebanyak 12 data
• Jumlah variabel yang banyak perlu dilakukan feature selection
• Hasil eksplorasi menunjukkan masih terdapat data berkorelasi tinggi maka
perlu dilakukan PCA
• Sebaran data tidak normal sehingga perlu dilakukan normalisasi
• Klasifikasi data NBA rookies dengan metode Hold Out dan Cross Validation
menghasilkan akurasi tertinggi pada metode klasifikasi Logistic Regression
24
Saran
Pada penelitian selanjutnya perlu dilakukan penelitian
lebih lanjut mengenai penyebab akurasi yang tidak terlalu
tinggi pada hasil klasifikasi, baik dari cara memanajemen
data, pre-processing data ataupun faktor-faktor lain yang
mempengaruhi sehingga diperoleh hasil klasifikasi yang
semakin baik
THANK YOU
25

Weitere ähnliche Inhalte

Kürzlich hochgeladen

MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdfAndiCoc
 
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMMPenyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMMRiniGela
 
Memperkasakan Dialog Prestasi Sekolah.pptx
Memperkasakan Dialog Prestasi Sekolah.pptxMemperkasakan Dialog Prestasi Sekolah.pptx
Memperkasakan Dialog Prestasi Sekolah.pptxsalmnor
 
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdfAndiCoc
 
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptxBab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptxrizalhabib4
 
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdfAndiCoc
 
Skenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru PenggerakSkenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru Penggerakputus34
 
Contoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxContoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxIvvatulAini
 
Kisi kisi Ujian sekolah mata pelajaran IPA 2024.docx
Kisi kisi Ujian sekolah mata pelajaran IPA 2024.docxKisi kisi Ujian sekolah mata pelajaran IPA 2024.docx
Kisi kisi Ujian sekolah mata pelajaran IPA 2024.docxFitriaSarmida1
 
Panduan Memahami Data Rapor Pendidikan 2024
Panduan Memahami Data Rapor Pendidikan 2024Panduan Memahami Data Rapor Pendidikan 2024
Panduan Memahami Data Rapor Pendidikan 2024RahmadLalu1
 
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
MODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
Prakarsa Perubahan dan kanvas ATAP (1).pptx
Prakarsa Perubahan dan kanvas ATAP (1).pptxPrakarsa Perubahan dan kanvas ATAP (1).pptx
Prakarsa Perubahan dan kanvas ATAP (1).pptxHaryKharismaSuhud
 
DEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptx
DEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptxDEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptx
DEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptxwawan479953
 
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdfAksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdfJarzaniIsmail
 
Aksi Nyata PMM Topik Refleksi Diri (1).pdf
Aksi Nyata PMM Topik Refleksi Diri (1).pdfAksi Nyata PMM Topik Refleksi Diri (1).pdf
Aksi Nyata PMM Topik Refleksi Diri (1).pdfEniNuraeni29
 
vIDEO kelayakan berita untuk mahasiswa.ppsx
vIDEO kelayakan berita untuk mahasiswa.ppsxvIDEO kelayakan berita untuk mahasiswa.ppsx
vIDEO kelayakan berita untuk mahasiswa.ppsxsyahrulutama16
 
Kenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).pptKenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).pptnovibernadina
 

Kürzlich hochgeladen (20)

MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
 
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
 
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMMPenyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
Penyebaran Pemahaman Merdeka Belajar Aksi Nyata PMM
 
Memperkasakan Dialog Prestasi Sekolah.pptx
Memperkasakan Dialog Prestasi Sekolah.pptxMemperkasakan Dialog Prestasi Sekolah.pptx
Memperkasakan Dialog Prestasi Sekolah.pptx
 
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
 
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptxBab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
 
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INDONESIA KELAS 5 KURIKULUM MERDEKA.pdf
 
Skenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru PenggerakSkenario Lokakarya 2 Pendidikan Guru Penggerak
Skenario Lokakarya 2 Pendidikan Guru Penggerak
 
Contoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptxContoh PPT Seminar Proposal Teknik Informatika.pptx
Contoh PPT Seminar Proposal Teknik Informatika.pptx
 
Kisi kisi Ujian sekolah mata pelajaran IPA 2024.docx
Kisi kisi Ujian sekolah mata pelajaran IPA 2024.docxKisi kisi Ujian sekolah mata pelajaran IPA 2024.docx
Kisi kisi Ujian sekolah mata pelajaran IPA 2024.docx
 
Panduan Memahami Data Rapor Pendidikan 2024
Panduan Memahami Data Rapor Pendidikan 2024Panduan Memahami Data Rapor Pendidikan 2024
Panduan Memahami Data Rapor Pendidikan 2024
 
Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...
Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...
Intellectual Discourse Business in Islamic Perspective - Mej Dr Mohd Adib Abd...
 
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
 
MODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 6 KURIKULUM MERDEKA.pdf
 
Prakarsa Perubahan dan kanvas ATAP (1).pptx
Prakarsa Perubahan dan kanvas ATAP (1).pptxPrakarsa Perubahan dan kanvas ATAP (1).pptx
Prakarsa Perubahan dan kanvas ATAP (1).pptx
 
DEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptx
DEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptxDEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptx
DEMONSTRASI KONTEKSTUAL MODUL 1.3 CGP 10.pptx
 
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdfAksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
Aksi Nyata Sosialisasi Profil Pelajar Pancasila.pdf
 
Aksi Nyata PMM Topik Refleksi Diri (1).pdf
Aksi Nyata PMM Topik Refleksi Diri (1).pdfAksi Nyata PMM Topik Refleksi Diri (1).pdf
Aksi Nyata PMM Topik Refleksi Diri (1).pdf
 
vIDEO kelayakan berita untuk mahasiswa.ppsx
vIDEO kelayakan berita untuk mahasiswa.ppsxvIDEO kelayakan berita untuk mahasiswa.ppsx
vIDEO kelayakan berita untuk mahasiswa.ppsx
 
Kenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).pptKenakalan Remaja (Penggunaan Narkoba).ppt
Kenakalan Remaja (Penggunaan Narkoba).ppt
 

Empfohlen

How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationErica Santiago
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellSaba Software
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming LanguageSimplilearn
 

Empfohlen (20)

How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
 

Perbandingan Klasifikasi Data NBA Rookies dengan Menggunakan Decision Tree, Random Forest, Gradient Boosting, Adaptive Boosting, Multilayer Perceptron, K-Nearest Neighbor, Naive Bayes dan Logistic Regression

  • 1. Oleh: Fraschiska Rizky R 06211540000022 Dosen Pengampu: Dr. Dra. Kartika Fithriasari, M.Si Novri Suhermi, S.Si, M.Sc Kelas Data Mining A 2018 Perbandingan Klasifikasi Data NBA Rookies dengan Menggunakan Decision Tree, Random Forest, Gradient Boosting, Adaptive Boosting, Multilayer Perceptron, K-Nearest Neighbor, Naive Bayes dan Logistic Regression 1
  • 2. 2 Outline 01 03 PENDAHULUAN ANALISIS DAN PEMBAHASAN 02 METODOLOGI PENELITIAN 04 KESIMPULAN DAN SARAN
  • 4. 4 NBA Rookie “Basket tidak hanya bersifat sebagai sebuah permainan biasa, akan tetapi berubah menjadi sebuah permainan profesional “ Statistik pemain dalam setiap pertandingan sangat penting Klasifikasi Pemain NBA Rookie dengan Decision Tree, Random Forest, Gradient Boosting, Adaptive Boosting, Multilayer Perceptron, K-Nearest Neighbor, Naive Bayes dan Logistic Regression
  • 6. 6 Data sekunder : Data NBA Rookies sebanyak 1340 data yang diperoleh dari Data World diakses tanggal 5 Desember 2018 pukul 19.00. Data terdiri dari dua kelas dengan kelas 0 berjumlah 509 data dan kelas 1 berjumlah 831 data Sumber Data
  • 7. 7 VARIABEL PENELITIAN No Variabel Keterangan Jenis Variabel 1. Nama Nama pemain rookie Independen 2. GP Jumlah pertandingan yang telah dialami pemain dalam 1 musim kompetisi Independen 3. MIN Durasi waktu pemain bermain selama pertandingan. Independen 4. PTS Skor yang diperoleh untuk setiap kali bertanding Independen 5. FGM Poin yang dicetak pemain selama pertandingan Independen 6. FGA Peluang dalam mencetak poin selama pertandingan Independen 7. FG% Persentase keberhasilan seorang pemain untuk mencetak poin selama pertandingan Independen 8. 3P Made Poin yang dicetak pemain melalui tembakan 3 angka selama pertandingan Independen 9. 3PA Peluang dalam mencetak poin melalui tembakan 3 angka selama pertandingan Independen 10. 3P% Persentase keberhasilan seorang pemain untuk mencetak poin melalui tembakan 3 angka selama pertandingan Independen 11. FTM Tembakan bebas atau tembakan hukuman yang dapat dieskekusi pemain selama pertandingan Independen 12. FTA Peluang seorang pemain mengeksekusi tembakan bebas atau tembakan hukuman selama pertandingan Independen
  • 8. 8 VARIABEL PENELITIAN No Variabel Keterangan Jenis Variabel 13. FT% Persentase keberhasilan seorang pemain dalam mengeksekusi tembakan bebas atau tembakan hukuman selama pertandingan Independen 14. OREB Perolehan bola netral atau bola mentah hasil tembakan tim serang pada saat posisi menyerang selama pertandingan Independen 15. DREB Perolehan bola netral atau bola mentah hasil tembakan tim serang pada saat posisi menyerang selama pertandingan Independen 16. REB Jumlah perolehan bola netral atau bola mentah selama pertandingan Independen 17. AST Hasil passing atau operan bola yang membuahkan poin dalam pertandingan Independen 18. STL Pencurian bola dari tangan tim lawan dalam pertandingan Independen 19. BLK Hasil menggagalkan tembakan pemain dari tim lawan dalam pertandingan Independen 20. TOV Kesalahan yang dilakukan pemain selama pertandingan Independen 21. TARGET_5Yrs Karir pemain rookie 0 : karir kurang dari 5 tahun 1 : karir lebih dari atau sama dengan 5 tahun Dependen
  • 9. 9 STRUKTUR DATA No X1 X2 X3 … Xj … XM 1 X11 X12 X13 … X1j … X1M 2 X21 X22 X23 … X2j … X2M 3 X31 X32 X33 … X3j … X3M ⁞ ⁞ ⁞ ⁞ … ⁞ ⁞ ⁞ i Xi1 Xi2 Xi3 … Xij … XiM ⁞ … … N XN1 XN2 XN3 … XNj … XNM
  • 16. 16 Feature Engineering data['GP-MIN']= data['GP'] * data['MIN'] data['GP-PTS']= data['GP'] * data['PTS'] Feature Selection Variabel terpilih : GP MIN FGA FG% 3P% FTM FT% OREB DREB GP-MIN GP-PTS
  • 17. 17 Normalisasi Data 0 1 2 .... 8 9 10 0 0.035086 0.026704 0.007407 .... 0.003314 0.961352 0.259635 1 0.035736 0.027466 0.006841 .... 0.002042 0.961309 0.257302 2 0.061612 0.012739 0.003913 .... 0.001415 0.942666 0.320383 3 0.076651 0.01533 0.007269 .... 0.001189 0.889151 0.43691 4 0.079878 0.019137 0.004992 .... 0.002496 0.918599 0.359452 Principal Component Analysis (PCA) 0 1 0 -0.006766 -0.09617 1 0.000044 -0.09585 2 -0.032776 -0.03974 3 -0.035078 0.095691 4 0.017843 0.026243
  • 18. 18 Klasifikasi Hold Out Method Metode Akurasi Sebelum Hyperparameter tuning Sesudah Hyperparameter tuning Decision tree 0.588345865 0.70112782 Random Forest 0.65037594 0.714285714 Gradient Boosting 0.657894737 0.697368421 AdaBoost 0.659774436 0.714285714 MLP 0.712406015 0.678571429 KNN 0.661654135 0.712406015 Naive Bayes 0.686090226 0.686090226 Logistic Regression 0.654135338 0.72556391
  • 19. 19 Klasifikasi CV - KFold Metode Akurasi Sebelum Hyperparameter tuning Sesudah Hyperparameter tuning Decision tree 0.6024 0.687473 Random Forest 0.640792 0.684455 Gradient Boosting 0.66492 0.677693 AdaBoost 0.660377 0.673931 MLP 0.685243 0.684477 KNN 0.663419 0.685221 Naive Bayes 0.670189 0.670189 Logistic Regression 0.655897 0.694257
  • 20. 20 Klasifikasi CV – Stratified KFold Metode Akurasi Sebelum Hyperparameter tuning Sesudah Hyperparameter tuning Decision tree 0.579807 0.675427 Random Forest 0.626447 0.684438 Gradient Boosting 0.661876 0.685919 AdaBoost 0.669355 0.678423 MLP 0.683681 0.6822 KNN 0.66264 0.688209 Naive Bayes 0.667134 0.667134 Logistic Regression 0.659604 0.694241
  • 21. 21 Perbandingan Hold Out Method dan Cross Validation Metode Hold Out KFold Stratified KFold Decision tree 0.70112782 0.687473 0.675427 Random Forest 0.714285714 0.684455 0.684438 Gradient Boosting 0.697368421 0.677693 0.685919 AdaBoost 0.714285714 0.673931 0.678423 MLP 0.678571429 0.684477 0.6822 KNN 0.712406015 0.685221 0.688209 Naive Bayes 0.686090226 0.670189 0.667134 Logistic Regression 0.72556391 0.694257 0.694241
  • 23. 23 Kesimpulan • Terdapat missing value pada variabel 3P% • Terdapat data duplikat sebanyak 12 data • Jumlah variabel yang banyak perlu dilakukan feature selection • Hasil eksplorasi menunjukkan masih terdapat data berkorelasi tinggi maka perlu dilakukan PCA • Sebaran data tidak normal sehingga perlu dilakukan normalisasi • Klasifikasi data NBA rookies dengan metode Hold Out dan Cross Validation menghasilkan akurasi tertinggi pada metode klasifikasi Logistic Regression
  • 24. 24 Saran Pada penelitian selanjutnya perlu dilakukan penelitian lebih lanjut mengenai penyebab akurasi yang tidak terlalu tinggi pada hasil klasifikasi, baik dari cara memanajemen data, pre-processing data ataupun faktor-faktor lain yang mempengaruhi sehingga diperoleh hasil klasifikasi yang semakin baik