SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Downloaden Sie, um offline zu lesen
KonsepData Mining 
Pendahuluan 
Bertalya 
UniversitasGunadarma 
2009
LatarBelakang 
•Data ygdikumpulkansemakin 
bertambahbanyak 
–Data web, e-commerce 
–Data pembelianditoko2 / supermarket 
–TransaksiBank/KartuKredit 
–Detail panggilantelepon 
–Statistikpemerintahan 
–Rekammedis 
–Database molekul 
–Citra astronomis 
Pendahuluan 2
LatarBelakang(lanj.) 
•Komputersekarangmurahdanpowefull 
•Tekanankompetisisemakinkuat 
–Menyediakanlayananyglbhbaik& customized(misdalamCustomer Relationship Management) 
•Teknikpenyimpanandata semakintinggidengankecepatantinggi(GB/jam) 
•Prosesekstraksiinformasididalamkumpulandata ygbesarmenjaditantangan 
•Pendekatananalisisdata tradisionaltidakdapatdigunakanutkmengekstrakdata dlmjumlahbesar 
•Data mining merupakanteknikygmenggabungkanteknikanalisisdata tradisionaldenganalgoritmaygsophisticatedutkpemrosesandata dlmjumlahbesar 
Pendahuluan 3
LatarBelakang(lanj.) 
•Informasiygdibutuhkanmisalnya: 
–Kebutuhandaripelanggan(data layanantelepon) 
–target respondenuntukpromosiproduk 
–Jenisprodukygpaling banyakterjual 
–Historistransaksidariseorangpelanggan 
–Pelangganyang paling loyal 
–Mengetahuiperilakugen2 dalamberbagaisituasi 
–Mengetahuiawaldanakhirmusimpadasuatuarea 
Informasi yang dibutuhkan seperti di atas dapat 
diekstrak dengan data mining 
Pendahuluan 4
DefinisiData Mining 
•Mengekstrakatau“mining”pengetahuandarikumpulandata ygsangatbesar 
•Ekstraksiinformasiygbergunadaridata, dimanasebelumnyatidakdiharapkan, tidakdikenal& implisit 
•Eksplorasi& analisis, secaraotomatisatausemi- otomatisdarisekumpulandata ygsangatbesaruntukmemperolehpola2 data ygberarti 
•Prosesanalisisdatabase ygbesarsecarasemi-otomatisutkmenemukanpolayang valid, baru, bergunadandapatdipahamimanusia 
Pendahuluan 5
AsalData Mining 
•Berasaldarimachine learning/AI, pattern recognition, statistics, & database systems•Tekniktradisionaltidaksesuaidisebabkankarena–Data ygsangat2 besar–Data dengandimensiygbesar–Data ygtersebar& heterogenMachine Learning/ Pattern RecognitionStatistics/ AIData MiningDatabase systems 
Pendahuluan 6
Ilmuyang BerkaitanDenganData Mining 
•Statistik 
Merupakandasarteoritetapihasilnyasulitdiinterpretasisertabutuhbantuandaripemakaiutkmelakukananalisisdata. 
•Machine Learning 
Merupakanprosespembelajaransecaraotomatis& pem- belajaraninisetaradgnkonstruksiaturan2 berbasispadakeadaan& transisidarilingkungansekitar. 
•SistemDatabase 
Data dikumpulkandandisimpandalamdatabase. 
Pendahuluan 7
TantanganData Mining 
•Skalabilitas, dikrnkanpenyimpanandata menggunakanukuranbesar(gigabyte, terabyte dst) makapadaprosesdata mining, kumpulandata harusdiskala 
•Dimensionalitasygtinggi, dimanadata ygdisimpanmemilikiatributdlmjumlahbesar, Sepertidata pengukuransuhudibeberapalokasiygmemilikikomponenwaktu& spasial 
•Data ygheterogen& kompleks, dimanadata mempunyaiatributygheterogen, cthkumpulanhalweb ygterdiriatasteksygsemi terstruktur& banyakterdapatlink. Teknikdata mining harusmempunyaiteknikotokorelasispasial& waktu, graph connectivity& keterhubunganparent-child antaraelementekssemi terstruktur& dokumenXML 
Pendahuluan 8
TantanganData Mining (lanj.) 
•Pendistribusian& kepemilikandata, dimanadata tersimpandilebihdarisatulokasi& dimilikilebihdarisatuorganisasi. Untukituteknikdata mining harusdapatal : (1)berkonsolidasi terhadaphasildata mining ygberasaldarisumberberbeda, (2) mengurangijumlahkomunikasiutkkomputasiygtersebar 
•Analisisygnon-tradisional, membutuhkanteknikevaluasi& penurunanribuanhipotesis 
Pendahuluan 9
Data mining merupakanbagiandariprosesKnowledge Discovery in Databases(KDD) –Prosestransformasidata mentahmenjadiinformasiberguna. 
Pendahuluan 10
Tahap2 padaKDD 
•Selection, penyeleksianatausegmentasidata berdasarkankriteriattt. 
•Preprocessing, tahappembersihandimanainfo. tidakbergunadibuang. Selainitudata dikonfigurasiulangutkmenjaminformat tetapkonsisten. 
•Transformation, prosestransformasisehinggadata dapatdigunakandanditelusuri. Pemetaan data 
kompleks 
•Data mining, prosesekstraksipoladaridata ygada. 
•Interpretation & evaluation, prosesinterpretasipolamenjadipengetahuanygdapatdigunakanutkmen- dukungpengambilankeputusan(cthprediksi& klasifikasi, ringkasankontendatabase sertapenjelasanfenomenaygdiamati. 
Pendahuluan 11
TugasData Mining 
•MetodePrediksi 
Menggunakanbeberapaatribututkmemprediksinilaidariatributygakandatang. Atributygakandiprediksidisbttargetataudependent variable. Atributygdigunakan disbt 
explanatoryatauindependent variable. 
2 tipe: 
-classification, digunakanuntukvariabeltarget diskrit 
-regression, digunakanuntukvariabeltarget kontinu 
•MetodeDeskripsi 
Menemukanpola2 (ygmenggambarkandata) ygdapatdiinterpretasikanmanusia 
•Clustering 
•Association Rule Discovery 
•Sequential Pattern Discovery 
Pendahuluan 12
AplikasiData Mining 
•Pemasaran/ Penyewaan 
–Identifikasipolapembayaranpelanggan 
–Menemukanasosiasidiantarakarakteristikdemografikpelanggan 
–Analisiskeranjangpemasaran 
•Perbankan 
–Mendeteksipolapenyalahgunaankartukredit 
–Identifikasipelangganygloyal 
–Mendeteksikartukreditygdihabiskanolehkelompokpelanggan 
•Asuransi& PelayananKesehatan 
–Analisisdariklaim 
–Memprediksipelangganygakanmembelipolis baru 
–Identifikasipolaperilakupelangganygberbahaya 
•Transformasi 
–Menentukanjadualdistribusikeoutlet2 
Pendahuluan 13
AplikasiData Mining (lanj.) 
•Pengobatan 
–Identifikasiterapipengobatanygberhasilutkpenyakitberbeda 
–Mengkarakterisasikanperilakupasienutkmemprediksikunjungan 
–Menganalisissejarahpenyakitpasien, sertamenemukanhubunganantarapenyakit2 ygada 
•Duniailmuwan 
–Mendeteksigalaksibaru 
Pendahuluan 14

Weitere ähnliche Inhalte

Ähnlich wie Pendahuluan kdm

Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptSalimSlw
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptOcha8
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxSuraClips
 
Pengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganPengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganBimastyaji Surya
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)ArianDerida
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxRidwanTI
 
Tahapan Analisis Data Digital
Tahapan Analisis Data DigitalTahapan Analisis Data Digital
Tahapan Analisis Data DigitalHendro Subagyo
 
Emerging data base technologies and application
Emerging data base technologies and applicationEmerging data base technologies and application
Emerging data base technologies and applicationYunus Thariq
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligenceRowell Ronny
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data miningLye Lazar
 

Ähnlich wie Pendahuluan kdm (20)

Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
pendahuluan dan proses kdd
pendahuluan dan proses kddpendahuluan dan proses kdd
pendahuluan dan proses kdd
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
 
Pengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganPengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik Lingkungan
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
 
Data mining
Data miningData mining
Data mining
 
Tahapan Analisis Data Digital
Tahapan Analisis Data DigitalTahapan Analisis Data Digital
Tahapan Analisis Data Digital
 
DM-Pertemuan_01.pptx
DM-Pertemuan_01.pptxDM-Pertemuan_01.pptx
DM-Pertemuan_01.pptx
 
MIK4237-02.pdf
MIK4237-02.pdfMIK4237-02.pdf
MIK4237-02.pdf
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
2. Pengantar Data Mining
2. Pengantar Data Mining2. Pengantar Data Mining
2. Pengantar Data Mining
 
Bab1.pptx
Bab1.pptxBab1.pptx
Bab1.pptx
 
Emerging data base technologies and application
Emerging data base technologies and applicationEmerging data base technologies and application
Emerging data base technologies and application
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
 

Mehr von Universitas Bina Darma Palembang

Mehr von Universitas Bina Darma Palembang (20)

30448 pertemuan1
30448 pertemuan130448 pertemuan1
30448 pertemuan1
 
29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))
 
28501 pertemuan14(php)
28501 pertemuan14(php)28501 pertemuan14(php)
28501 pertemuan14(php)
 
28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)
 
25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)
 
23921 pertemuan 3
23921 pertemuan 323921 pertemuan 3
23921 pertemuan 3
 
19313 pertemuan6
19313 pertemuan619313 pertemuan6
19313 pertemuan6
 
18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)
 
18040 pertemuan13(css)
18040 pertemuan13(css)18040 pertemuan13(css)
18040 pertemuan13(css)
 
17945 pertemuan5
17945 pertemuan517945 pertemuan5
17945 pertemuan5
 
16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)
 
15294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah015294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah0
 
13926 pertemuan4
13926 pertemuan413926 pertemuan4
13926 pertemuan4
 
12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)
 
6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)
 
5623 pertemuan11(html1)
5623 pertemuan11(html1)5623 pertemuan11(html1)
5623 pertemuan11(html1)
 
4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)
 
4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)
 
2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)
 
2190 pertemuan24(polling)
2190 pertemuan24(polling)2190 pertemuan24(polling)
2190 pertemuan24(polling)
 

Kürzlich hochgeladen

KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANDevonneDillaElFachri
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningSamFChaerul
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Shary Armonitha
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksdanzztzy405
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfjeffrisovana999
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxzidanlbs25
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfAuliaAulia63
 

Kürzlich hochgeladen (8)

KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data mining
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdf
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdf
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
 

Pendahuluan kdm

  • 1. KonsepData Mining Pendahuluan Bertalya UniversitasGunadarma 2009
  • 2. LatarBelakang •Data ygdikumpulkansemakin bertambahbanyak –Data web, e-commerce –Data pembelianditoko2 / supermarket –TransaksiBank/KartuKredit –Detail panggilantelepon –Statistikpemerintahan –Rekammedis –Database molekul –Citra astronomis Pendahuluan 2
  • 3. LatarBelakang(lanj.) •Komputersekarangmurahdanpowefull •Tekanankompetisisemakinkuat –Menyediakanlayananyglbhbaik& customized(misdalamCustomer Relationship Management) •Teknikpenyimpanandata semakintinggidengankecepatantinggi(GB/jam) •Prosesekstraksiinformasididalamkumpulandata ygbesarmenjaditantangan •Pendekatananalisisdata tradisionaltidakdapatdigunakanutkmengekstrakdata dlmjumlahbesar •Data mining merupakanteknikygmenggabungkanteknikanalisisdata tradisionaldenganalgoritmaygsophisticatedutkpemrosesandata dlmjumlahbesar Pendahuluan 3
  • 4. LatarBelakang(lanj.) •Informasiygdibutuhkanmisalnya: –Kebutuhandaripelanggan(data layanantelepon) –target respondenuntukpromosiproduk –Jenisprodukygpaling banyakterjual –Historistransaksidariseorangpelanggan –Pelangganyang paling loyal –Mengetahuiperilakugen2 dalamberbagaisituasi –Mengetahuiawaldanakhirmusimpadasuatuarea Informasi yang dibutuhkan seperti di atas dapat diekstrak dengan data mining Pendahuluan 4
  • 5. DefinisiData Mining •Mengekstrakatau“mining”pengetahuandarikumpulandata ygsangatbesar •Ekstraksiinformasiygbergunadaridata, dimanasebelumnyatidakdiharapkan, tidakdikenal& implisit •Eksplorasi& analisis, secaraotomatisatausemi- otomatisdarisekumpulandata ygsangatbesaruntukmemperolehpola2 data ygberarti •Prosesanalisisdatabase ygbesarsecarasemi-otomatisutkmenemukanpolayang valid, baru, bergunadandapatdipahamimanusia Pendahuluan 5
  • 6. AsalData Mining •Berasaldarimachine learning/AI, pattern recognition, statistics, & database systems•Tekniktradisionaltidaksesuaidisebabkankarena–Data ygsangat2 besar–Data dengandimensiygbesar–Data ygtersebar& heterogenMachine Learning/ Pattern RecognitionStatistics/ AIData MiningDatabase systems Pendahuluan 6
  • 7. Ilmuyang BerkaitanDenganData Mining •Statistik Merupakandasarteoritetapihasilnyasulitdiinterpretasisertabutuhbantuandaripemakaiutkmelakukananalisisdata. •Machine Learning Merupakanprosespembelajaransecaraotomatis& pem- belajaraninisetaradgnkonstruksiaturan2 berbasispadakeadaan& transisidarilingkungansekitar. •SistemDatabase Data dikumpulkandandisimpandalamdatabase. Pendahuluan 7
  • 8. TantanganData Mining •Skalabilitas, dikrnkanpenyimpanandata menggunakanukuranbesar(gigabyte, terabyte dst) makapadaprosesdata mining, kumpulandata harusdiskala •Dimensionalitasygtinggi, dimanadata ygdisimpanmemilikiatributdlmjumlahbesar, Sepertidata pengukuransuhudibeberapalokasiygmemilikikomponenwaktu& spasial •Data ygheterogen& kompleks, dimanadata mempunyaiatributygheterogen, cthkumpulanhalweb ygterdiriatasteksygsemi terstruktur& banyakterdapatlink. Teknikdata mining harusmempunyaiteknikotokorelasispasial& waktu, graph connectivity& keterhubunganparent-child antaraelementekssemi terstruktur& dokumenXML Pendahuluan 8
  • 9. TantanganData Mining (lanj.) •Pendistribusian& kepemilikandata, dimanadata tersimpandilebihdarisatulokasi& dimilikilebihdarisatuorganisasi. Untukituteknikdata mining harusdapatal : (1)berkonsolidasi terhadaphasildata mining ygberasaldarisumberberbeda, (2) mengurangijumlahkomunikasiutkkomputasiygtersebar •Analisisygnon-tradisional, membutuhkanteknikevaluasi& penurunanribuanhipotesis Pendahuluan 9
  • 10. Data mining merupakanbagiandariprosesKnowledge Discovery in Databases(KDD) –Prosestransformasidata mentahmenjadiinformasiberguna. Pendahuluan 10
  • 11. Tahap2 padaKDD •Selection, penyeleksianatausegmentasidata berdasarkankriteriattt. •Preprocessing, tahappembersihandimanainfo. tidakbergunadibuang. Selainitudata dikonfigurasiulangutkmenjaminformat tetapkonsisten. •Transformation, prosestransformasisehinggadata dapatdigunakandanditelusuri. Pemetaan data kompleks •Data mining, prosesekstraksipoladaridata ygada. •Interpretation & evaluation, prosesinterpretasipolamenjadipengetahuanygdapatdigunakanutkmen- dukungpengambilankeputusan(cthprediksi& klasifikasi, ringkasankontendatabase sertapenjelasanfenomenaygdiamati. Pendahuluan 11
  • 12. TugasData Mining •MetodePrediksi Menggunakanbeberapaatribututkmemprediksinilaidariatributygakandatang. Atributygakandiprediksidisbttargetataudependent variable. Atributygdigunakan disbt explanatoryatauindependent variable. 2 tipe: -classification, digunakanuntukvariabeltarget diskrit -regression, digunakanuntukvariabeltarget kontinu •MetodeDeskripsi Menemukanpola2 (ygmenggambarkandata) ygdapatdiinterpretasikanmanusia •Clustering •Association Rule Discovery •Sequential Pattern Discovery Pendahuluan 12
  • 13. AplikasiData Mining •Pemasaran/ Penyewaan –Identifikasipolapembayaranpelanggan –Menemukanasosiasidiantarakarakteristikdemografikpelanggan –Analisiskeranjangpemasaran •Perbankan –Mendeteksipolapenyalahgunaankartukredit –Identifikasipelangganygloyal –Mendeteksikartukreditygdihabiskanolehkelompokpelanggan •Asuransi& PelayananKesehatan –Analisisdariklaim –Memprediksipelangganygakanmembelipolis baru –Identifikasipolaperilakupelangganygberbahaya •Transformasi –Menentukanjadualdistribusikeoutlet2 Pendahuluan 13
  • 14. AplikasiData Mining (lanj.) •Pengobatan –Identifikasiterapipengobatanygberhasilutkpenyakitberbeda –Mengkarakterisasikanperilakupasienutkmemprediksikunjungan –Menganalisissejarahpenyakitpasien, sertamenemukanhubunganantarapenyakit2 ygada •Duniailmuwan –Mendeteksigalaksibaru Pendahuluan 14