4 langkah proses desain model multidimensi meliputi pemilihan proses bisnis, penetapan grain terkecil, pemilihan dimensi, dan identifikasi fakta numerik. Langkah-langkah ini diterapkan pada studi kasus jaringan grosir besar untuk membangun skema data penjualan ritel yang mencakup tabel fakta dan tabel dimensi seperti tanggal, produk, toko, dan promosi.
2. 4 Langkah Proses Desain
Model Multidimensi
1. Pilih proses bisnis yang akan dimodelkan
Proses : aktivitas bisnis yang dilakukan di organisasi yang
umumnya didukung oleh sistem koleksi data
Cara paling efektif memilih bisnis proses : dengarkan apa
yang disampaikan user
Contoh bisnis proses : pembelian bahan baku, pesanan,
pengiriman, pembuatan invoice, penyimpanan, pembuatan
struk
1. Tentukan grain (inti terkecil) dari proses bisnis tersebut
Tentukan secara tepat apa yang digambarkan dalam setiap
baris dari tabel fakta
Merupakan jawaban dari : “ Bagaimana anda
menggambarkan satu baris dalam tabel fakta ?”
Contoh :
satu baris Item barang dalam struk pembelian
data harian level inventori suatu barang
satu boarding pass untuk masuk ke pesawat
gambaran bulanan untuk satu rekening bank
3. 4 Langkah Proses Desain
Model Multidimensi(2)
3. Pilih dimensi-dimensi yang terkait dengan tabel
fakta
Menjawab pertanyaan: “Bagaimana pelaku bisnis
menggambarkan data yang dihasilkan dari bisnis
proses ?” produknya apa, kapan dibelinya ?
Contoh dimensi: date, produk, customer, lokasi, etc
4. Identifikasi fakta-fakta numerik
“Apa yang kita ukur ?”
Pengguna bisnis sangat tertarik menganalisa ukuran-
ukuran performansi suatu proses bisnis
Semua kandidat ukuran harus sesuai dengan grain
yang didefinisikan di langkah no. 2
Fakta umunya berupa angka. Contoh fakta:
kuantitas pemesanan, total biaya, etc
4. Studi Kasus
Jaringan Grosir Besar, 100 toko grosir di lima
propinsi
Masing-masing toko mempunyai
departemen/bagian : grosir, makanan beku,
daging, sayuran, roti, hasil olahan susu, bunga,
kesehatan/kecantikan
Masing-masing toko punya kira-kira 60.000 produk.
Setiap produk diberi nomor SKU (stock keeping
unit). 55.000 diantaranya disupply oleh dari luar
yang ada UPC (Universal Product Codes), 5000
sisanya adalah produk dari departemen bunga,
daging, roti, sayuran sehingga tidak ada UPC-nya
5. 1. Pilih Proses Bisnis
Manajemen ingin mengerti secara lebih
baik pembelian yang dilakukan
pelanggan sebagaimana yang terekam
dalam sistem POS (Point of Sales)
Jadi, proses bisnis yang akan kita
modelkan adalah : “penjualan ritel POS”
Data ini akan memungkinkan kita untuk
menganalisa produk-produk apa yang
sedang ramai terjual di toko mana, kapan
dan dalam rangka promosi apa
6. 2. Tentukan Grain
Tip : tentukan informasi yang paling atomic
(kecil) yang tidak bisa dibagi/dipecah lagi
Dalam studi kasus ini, informasi yang paling
kecil adalah : item barang yang dibeli
dalam suatu transaksi (yang dicatat oleh
sistem POS)
Kenapa harus atomic? Fleksibilitas yang
maksimum untuk proses analisa.
Contoh : dengan informasi yang atomic,
bisa mengetahui perbedaan penjualan
untuk suatu produk antara jam 6.00 – 12.00
dan 12.00 – 18.00.
7. 3. Pilih Dimensi
Ada 4 dimensi yang terkait denganAda 4 dimensi yang terkait dengan
informasi yang sudah ditentukan padainformasi yang sudah ditentukan pada
langkah 2 :langkah 2 :
8. 4. Identifikasi Fakta Numerik Ada tiga fakta yang diambil oleh sistem POS :
sales quantity, sales dollar amount, cost dollar
amount
16. Contoh kasus query:
Seorang pengguna bisnis mungkin tertarik
untuk mengetahui lebih dalam mengenai
penjualan mingguan (dlm dollar)
berdasarkan promosi untuk kategori
snack selama Januari 2002 untuk semua
Store yang ada di District Boston
21. Problem with Snowflaking
(Normalisasi Tabel Dimensi)
1. Gambaran yang terlalu kompleks, padahal salah
satu tujuan utama Denormalisasi Model Dimensi
adalah Kesederhanaan(Simplicity)
2. Terlalu banyaknya tabel dan juga proses Join
yang harus dilakukan menyebabkan performansi
query yang lamban
3. Pengurangan Space Memory dengan normalisasi
tabel dimensi tidak signifikan
4. Snowflaking akan memperlambat kemampuan
pengguna untuk browsing (mencari informasi)
dalam satu tabel dimensi.
Browsing seringkali mencakup pembatasan satu
atau lebih atribut dimensi dan melihat nilai yang
berbeda dari atribut yang lain dengan adanya
batasan tersebut.
Dengan browsing pengguna dapat memahami