Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Proposal penelitian
1. SIG 1
EKSTRAKSI TOPIK UTAMA HARIAN DARI PORTAL
BERITA INDONESIA ONLINE MENGGUNAKAN
SINGULAR VALUE DECOMPOTISION
Oleh :
ASHARI NURHIDAYAT
(0706261562)
2. 2
ISI PRESENTASI
LATAR BELAKANG
RUMUSAN MASALAH
TUJUAN PENELITIAN
METODOLOGI PENELITIAN
RENCANA PENELITIAN
DAFTAR PUSTAKA
30/03/2012 Universitas Indonesia
3. 3
Latar Belakang
Sumber: google.co.id/publicdata
Gambar 1. Grafik presentase pengguna Internet di Indonesia
30/03/2012 Universitas Indonesia
4. 4
Latar Belakang (Cont’d...)
41%
Akses internet
46%
menggunakan Akses internet
perangkat tidak menggunakan
13% bergerak Handphone
Akses internet
menggunakan
perangkat
bergerak lain
Gambar 2. Grafik presentase pengguna Internet
berdasar perangkat
30/03/2012 Universitas Indonesia
5. 5
Latar Belakang (Cont’d...)
Aktifitas
89
72 70
61
2010
SosMed Web
SE Berita
Gambar 3. presentase aktifitas
online terpopuler
30/03/2012 Universitas Indonesia
6. 6
Latar Belakang (Cont’d...)
Mudah diakses
Berita Teraktual
Dokumen tidak panjang
namun jumlahnya banyak
30/03/2012 Universitas Indonesia
7. 7
Latar Belakang (Cont’d...)
Kendala
Banyaknya berita yang terpublikasi, maka hampir tidak mungkin
untuk membaca satu-persatu.
Pencarian Topik Utama
Dibutuhkan untuk mengetahui trending topic dalam satu hari dan
dapat dijadikan dasar pengambilan kebijakan.
30/03/2012 Universitas Indonesia
8. 8
Latar Belakang (Cont’d...)
Ekstraksi Fitur
mencari sekumpulan data yang jika dikombinasikan, dapat
membentuk kembali kumpulan data semula (Toby Segaran: 2007)
LSA
Latent Semantic Analysis merupakan salah satu teknik untuk
mengekstraksi topik utama dari kumpulan berita (Deerwester:1990).
SVD
Faktorisasi matriks menjadi tiga matriks yang lebih sederhana
Fleksibel terhadap perubahan rank matriks
30/03/2012 Universitas Indonesia
9. 9
Latar Belakang (Cont’d...)
Merubah dokumen menjadi vektor dan
menggabungkan menjadi matriks.
kata d1 d2 d3 .. dn
kritik 1 0 1 ..
BBM 0 2 1 ..
naik 0 2 1 ..
Dokumen
: ..
kebijakan 1 0 0 ..
Kata
A=
30/03/2012 Universitas Indonesia
10. 10
Latar Belakang (Cont’d...)
Faktorisasi SVD
n-Dokumen m n n
m-Kata
m
= x
m
x
n
Dimana :
= Matriks dokumen-kata sebenarnya
= Matriks Ortogonal kiri
= Matriks semidiagonal nialai singular (Golub:1996)
= Matriks Ortogonal kanan
30/03/2012 Universitas Indonesia
11. 11
Latar Belakang (Cont’d...)
Pengecilan rank SVD
SVD fleksibel terhadap rank dari matriks, defiesnsi rank matriks
akan dihitung dengan baik karena nilai-nilai singular memberikan
indikasi kedekatan matriks awal dengan matriks lain yang
memiliki rank lebih kecil
n-Dokumen k m-k k n-k n
k
m-Kata
k
= x x
m
m-k
n-k
(Golub:1996)
30/03/2012 Universitas Indonesia
12. 12
Latar Belakang (Cont’d...)
Hasil dengan SVD
n-Dokumen k k n
k
m-Kata
k
= x x
m
Koleksi kata
dari k topik
utama
30/03/2012 Universitas Indonesia
13. 13
Perumusan Masalah
bagaimana menganalisa penggunaan
faktorisasi SVD pada metode LSA
untuk mengekstraksi topik-topik utama
harian kumpulan dokumen berita
online berbahasa Indonesia?.
30/03/2012 Universitas Indonesia
14. 14
Tujuan Penelitian
Menganalisa penggunaan faktorisasi SVD
pada metode LSA untuk mengekstraksi
topik-topik utama harian kumpulan
dokumen berita online berbahasa
Indonesia.
30/03/2012 Universitas Indonesia
15. 15
Metodologi Penelitian
• Interpretasi dan Analisa Hasil
• Implementasi Algoritma dan Simulasi
• Pengumpulan Data
• Studi Literatur dan Perumusan Masalah
30/03/2012 Universitas Indonesia
16. 16
Rencana Penelitian
Bulan ke-
Sistematika Penelitian
1 2 3 4 5
Studi literatur
Perancangan Algoritma
Penulisan Algoritma dalam Bahasa Program
Pengumpulan Data
Simulasi
Penulisan Hasil Penelitian
Tabel 1. Rencana Penelitian
30/03/2012 Universitas Indonesia
17. 17
REFERENSI
Deerwester, S. dkk. (1990). Indexing by Latent Semantic
Analysis. Journal of American Society for Information
Science (1986-1998), 41.
Golub, H, Gene. Van Loan, Charles, F. (1996). Matrix
Computations (3rd Ed.). London : The Jhons Hopkins Press
Ltd.
Murfi, Hendri. (2010). Machine Learning for Text Indexing.
Disertasi. Berlin: Von der Fakultat IV -- Elektrotechnik und
Informatik der Technischen Universitat.
Segaran, Toby. (2007). Programming Collective Intelligence.
Sebastopol, CA: O’Reilly Media, Inc.
Wiemer-Hasting, Peter. (2004). Latent Semantic Analysis.
Chicago: School of Computer Science, Telecommunications
and Information Systems, DePaul University.
30/03/2012 Universitas Indonesia