26813 9 arsitektur data mining

Universitas Bina Darma Palembang
Universitas Bina Darma PalembangManager (association football) um Universitas Bina Darma Palembang
26813 9 arsitektur data mining
Arsitektur : Sistm Data Mining
Graphical User Interface (GUI)
Pattern evaluation
Data Mining Engine
Database or data warehouse
server
Knowledge-base
Data base Data warehouse
Data clening & data integration Filtering
Keterangan :
1. Data cleaning (Pembersihan Data) : untuk membuang
data yang tidak konsisten dan noise)
2. Data integration : penggabungan data dari beberapa
sumber
3. Data Mining Engine : Mentranformasikan data menjadi
bentuk yang sesuai untuk di mining
4. Pattern evaluation : untuk menemukan yang bernilai
melalui knowledge base
5. Graphical User Interface (GUI) : untuk end user
Semua tahap bersifat interaktif di mana user terlibat
langsung atau dengan perantaraan knowledge base
Model Data Mining
Prediction Methods
Menggunakan beberapa variabel untuk
memprediksi sesuatu atau suatu nilai yang akan
datang.
Description Methods
 Mendapatkan pola penafsiran (human-
interpretable patterns) untuk menjelaskan data.
Data Mining
Prediktif Deskriptif
Klasifikasi
Decision tree
Analisis Time series
Regresi
Prediksi
Jaringan syaraf tiruan
Klastering
Summarization
Aturan Asosiasi
(Assosiation Rule)
Sequence Discovery
Klasifikasi
 Proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk dapat
memprediksi kelas dari suatu objek yang labelnya tidak diketahui
 Contoh : Mendeteksi Penipuan
 Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit.
 Pendekatan :
 Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut
account holder
 Kapan cutomer melakukan pembelian, Dengan cara apa customer
membayar, sebarapa sering customer membayar secara tepat waktu,
dll
 Beri nama/tanda transaksi yang telah dilaksanakan sebagai transaksi
yang curang atau yang baik. Ini sebagai atribut klass ( the class
attribute.)
 Pelajari model untuk class transaksi
 Gunakan model ini untuk mendetekdi kecurangan dengan meneliti
transaksi kartu kredit pada account.
Regression
 Digunakan untuk memetakan data dengan prediksi atribut
bernilai real
 Contoh:
 Memprediksi jumlah penjualan produk baru pada
advertising expenditure.
 Memprediksi kecepatan memutar (wind velocities) pada
fungsi temperatur, tekanan udara , dll
Decision tree (Pohon keputusan)
 Salah satu model klasifikasi yang mudah di interpretasikan
 Contoh : identifikasi pembeli komputer ( dari decision tree di
bawah ini ternyata salah satu kelompok yang potensial adalah
orang yang berusia < 30 dan pelajar
age
studen Credit rating
yes
yesnoyesno
<=30 31-40 >40
yesno excelent fair
 Jaringan syaraf buatan di mulai dengan layer input, dimana
tiap simpul berkorespondensi dengan variabel prediktor.
 Simpul- simpul input ini terhubung kebeberapa simpul
dalam hidden layer.
 Dan simpul dalam hidden layer dapat terhubung ke simpul
lain dalam hidden layer atau ke output layer.
 Output layer terdiri dari satu atau beberapa variable respon
Neural Network (Jaringan syaraf tiruan)
1
2
5
4
3
6
input
Hidden layer
output
 Telekomunikasi
Data mining digunakan untuk melihat jutaan transaksi
yang masuk dengan tujuan menambah layanan otomatis
 Keuangan
Data mining digunakan untuk mendeteksi transaksi-
transaksi keuangan yang mencurigakan dimana akan susah
dilakukan jika menggunakan analisis standar.
 Asuransi
Australian Health Insurance Commision menggunakan data
mining untuk mengidentifikasi layanan kesehatan dan
berhasil menghemat satu juta dollar pertahun
 Astronomi
Jet Propulsion Laboratory (JPL) di Pasadena dan Pulomar
Observatory menemukan 22 quasar dengan bantuan data
mining.
 Olah raga
IBM Advanced Scout menggunakan data mining untuk
menganalisis statistik permainan NBA dalam rangka competitive
advantage untuk tim New York Knicks
 Internet Web Surf-Aid
IBM Surf-Aid menggunakan algoritma data mining untuk mendata
akses halaman Web khususnya berkaitan dengan pemasaran melalui
web.
Tools Data Mining
 Karateristik-karateristik penting dari tool data mining
meliputi :
 Data preparation facilities
 Selection of data mining operation (algorithms)
 Product scalability and performance
 Facilities for visualization of result
 Data mining tool, meliputi :
 Integral Solution Ltd’s Clementine
 DataMind Corp’s Data Crusher
 IBM’s Intelligent Miner
 Silicon Graphics Inc.’s MineSet
 Informations Discovery Inc.’s Data Mining Suite
 SAS Institute Inc.’s SAS System and Right Information
System’Thought.
1 von 12

Más contenido relacionado

Was ist angesagt?(20)

Karakteristik data warehouseKarakteristik data warehouse
Karakteristik data warehouse
suleman ganteng4.1K views
2. Pengantar Data Mining2. Pengantar Data Mining
2. Pengantar Data Mining
Universitas Serang Raya208 views
1010
10
dedesumarni339 views
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
Alvian yudha Prawira1.1K views
3. Konsep Data Mining3. Konsep Data Mining
3. Konsep Data Mining
Universitas Serang Raya173 views
Definisi data-warehouseDefinisi data-warehouse
Definisi data-warehouse
Rian Wibowo6.9K views
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining full
Munajat ( Munjob )211 views
Data warehouseData warehouse
Data warehouse
Helmy Faisal5.9K views
Pertemuan 1 DWOPertemuan 1 DWO
Pertemuan 1 DWO
anovie120 views
Proses Data MiningProses Data Mining
Proses Data Mining
dedidarwis24.3K views
Pertemuan 11 Kualitas DataPertemuan 11 Kualitas Data
Pertemuan 11 Kualitas Data
Endang Retnoningsih1.9K views
484 922-1-pb484 922-1-pb
484 922-1-pb
adhiethyo299 views
Pertemuan 2 Konsep Dasar DWPertemuan 2 Konsep Dasar DW
Pertemuan 2 Konsep Dasar DW
Endang Retnoningsih207 views
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
dedidarwis15.6K views
Chapter 11   Data ManagementChapter 11   Data Management
Chapter 11 Data Management
Hani Novita484 views

Similar a 26813 9 arsitektur data mining

Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdfHasanulFahmi2
7 views10 Folien
DATA MININGDATA MINING
DATA MININGAdam Fahmi
109 views14 Folien
093-P01.pdf093-P01.pdf
093-P01.pdfWawanSnea
1 view44 Folien
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MININGNanzalXIV
13 views37 Folien

Similar a 26813 9 arsitektur data mining(20)

Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptx
ArwansyahDipanegara1 view
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
HasanulFahmi27 views
DATA MININGDATA MINING
DATA MINING
Adam Fahmi109 views
093-P01.pdf093-P01.pdf
093-P01.pdf
WawanSnea1 view
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
NanzalXIV13 views
LN s10-machine vision-s2LN s10-machine vision-s2
LN s10-machine vision-s2
Binus Online Learning318 views
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
HendroGunawan83 views
Big data.pptxBig data.pptx
Big data.pptx
AgusMailana1457 views
fuzzyShpfuzzyShp
fuzzyShp
Moh Mabrul408 views
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Andika Dwi Hadiri108 views
AI Security .pptxAI Security .pptx
AI Security .pptx
OperatorPolina6 views
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
Kacung Abdullah4.4K views
Machine learning dan data miningMachine learning dan data mining
Machine learning dan data mining
Alvian yudha Prawira10.8K views

Más de Universitas Bina Darma Palembang(20)

30448 pertemuan130448 pertemuan1
30448 pertemuan1
Universitas Bina Darma Palembang741 views
29510 pertemuan18(form method-get-post-dan-session(1))29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))
Universitas Bina Darma Palembang563 views
28501 pertemuan14(php)28501 pertemuan14(php)
28501 pertemuan14(php)
Universitas Bina Darma Palembang379 views
28500 pertemuan22(header dokumen html dgn tag title)28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)
Universitas Bina Darma Palembang377 views
25437 pertemuan25(hitcounter)25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)
Universitas Bina Darma Palembang340 views
23921 pertemuan 323921 pertemuan 3
23921 pertemuan 3
Universitas Bina Darma Palembang345 views
19313 pertemuan619313 pertemuan6
19313 pertemuan6
Universitas Bina Darma Palembang282 views
18759 pertemuan20(web html editor)18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)
Universitas Bina Darma Palembang326 views
18040 pertemuan13(css)18040 pertemuan13(css)
18040 pertemuan13(css)
Universitas Bina Darma Palembang257 views
17945 pertemuan517945 pertemuan5
17945 pertemuan5
Universitas Bina Darma Palembang190 views
16406 pertemuan17(konsep basis-data-di-web)16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)
Universitas Bina Darma Palembang374 views
15294 pertemuan9(eksplorasi &defenisi masalah015294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah0
Universitas Bina Darma Palembang244 views
13926 pertemuan413926 pertemuan4
13926 pertemuan4
Universitas Bina Darma Palembang241 views
12738 pertemuan 15(php lanjutan)12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)
Universitas Bina Darma Palembang234 views
6346 pertemuan21(web statis dengan struktur html)6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)
Universitas Bina Darma Palembang284 views
5623 pertemuan11(html1)5623 pertemuan11(html1)
5623 pertemuan11(html1)
Universitas Bina Darma Palembang224 views
4740 pertemuan8(komponen dalam web)4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)
Universitas Bina Darma Palembang152 views
4075 pertemuan10 (analisa kebutuhan)4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)
Universitas Bina Darma Palembang187 views
2670 pertemuan12(html lanjut)2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)
Universitas Bina Darma Palembang193 views
2190 pertemuan24(polling)2190 pertemuan24(polling)
2190 pertemuan24(polling)
Universitas Bina Darma Palembang169 views

26813 9 arsitektur data mining

  • 2. Arsitektur : Sistm Data Mining Graphical User Interface (GUI) Pattern evaluation Data Mining Engine Database or data warehouse server Knowledge-base Data base Data warehouse Data clening & data integration Filtering
  • 3. Keterangan : 1. Data cleaning (Pembersihan Data) : untuk membuang data yang tidak konsisten dan noise) 2. Data integration : penggabungan data dari beberapa sumber 3. Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai untuk di mining 4. Pattern evaluation : untuk menemukan yang bernilai melalui knowledge base 5. Graphical User Interface (GUI) : untuk end user Semua tahap bersifat interaktif di mana user terlibat langsung atau dengan perantaraan knowledge base
  • 4. Model Data Mining Prediction Methods Menggunakan beberapa variabel untuk memprediksi sesuatu atau suatu nilai yang akan datang. Description Methods  Mendapatkan pola penafsiran (human- interpretable patterns) untuk menjelaskan data.
  • 5. Data Mining Prediktif Deskriptif Klasifikasi Decision tree Analisis Time series Regresi Prediksi Jaringan syaraf tiruan Klastering Summarization Aturan Asosiasi (Assosiation Rule) Sequence Discovery
  • 6. Klasifikasi  Proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat memprediksi kelas dari suatu objek yang labelnya tidak diketahui  Contoh : Mendeteksi Penipuan  Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit.  Pendekatan :  Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut account holder  Kapan cutomer melakukan pembelian, Dengan cara apa customer membayar, sebarapa sering customer membayar secara tepat waktu, dll  Beri nama/tanda transaksi yang telah dilaksanakan sebagai transaksi yang curang atau yang baik. Ini sebagai atribut klass ( the class attribute.)  Pelajari model untuk class transaksi  Gunakan model ini untuk mendetekdi kecurangan dengan meneliti transaksi kartu kredit pada account.
  • 7. Regression  Digunakan untuk memetakan data dengan prediksi atribut bernilai real  Contoh:  Memprediksi jumlah penjualan produk baru pada advertising expenditure.  Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara , dll
  • 8. Decision tree (Pohon keputusan)  Salah satu model klasifikasi yang mudah di interpretasikan  Contoh : identifikasi pembeli komputer ( dari decision tree di bawah ini ternyata salah satu kelompok yang potensial adalah orang yang berusia < 30 dan pelajar age studen Credit rating yes yesnoyesno <=30 31-40 >40 yesno excelent fair
  • 9.  Jaringan syaraf buatan di mulai dengan layer input, dimana tiap simpul berkorespondensi dengan variabel prediktor.  Simpul- simpul input ini terhubung kebeberapa simpul dalam hidden layer.  Dan simpul dalam hidden layer dapat terhubung ke simpul lain dalam hidden layer atau ke output layer.  Output layer terdiri dari satu atau beberapa variable respon Neural Network (Jaringan syaraf tiruan) 1 2 5 4 3 6 input Hidden layer output
  • 10.  Telekomunikasi Data mining digunakan untuk melihat jutaan transaksi yang masuk dengan tujuan menambah layanan otomatis  Keuangan Data mining digunakan untuk mendeteksi transaksi- transaksi keuangan yang mencurigakan dimana akan susah dilakukan jika menggunakan analisis standar.  Asuransi Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan dan berhasil menghemat satu juta dollar pertahun
  • 11.  Astronomi Jet Propulsion Laboratory (JPL) di Pasadena dan Pulomar Observatory menemukan 22 quasar dengan bantuan data mining.  Olah raga IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA dalam rangka competitive advantage untuk tim New York Knicks  Internet Web Surf-Aid IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web khususnya berkaitan dengan pemasaran melalui web.
  • 12. Tools Data Mining  Karateristik-karateristik penting dari tool data mining meliputi :  Data preparation facilities  Selection of data mining operation (algorithms)  Product scalability and performance  Facilities for visualization of result  Data mining tool, meliputi :  Integral Solution Ltd’s Clementine  DataMind Corp’s Data Crusher  IBM’s Intelligent Miner  Silicon Graphics Inc.’s MineSet  Informations Discovery Inc.’s Data Mining Suite  SAS Institute Inc.’s SAS System and Right Information System’Thought.