Dokumen tersebut merangkum pengembangan sistem pencarian berita daring berbasis agen. Sistem ini dapat mengambil berita dari situs berita, melakukan pencarian berita berdasarkan kata kunci, dan menampilkan hasilnya kepada pengguna. Sistem ini menggunakan beberapa metode seperti JSOUP, JADE, stemming, TF-IDF, dan vector space model.
1. PENGEMBANGAN SISTEM TEMU KEMBALI
INFORMASI BERBASIS AGENT UNTUK
PENCARIAN BERITA ONLINE
OLEH :
S AY VA L B A L A D – 51 0 8 1 0 01 48
DOSEN PEMBIMBING I
WASKIT HO WI B I SO NO, S.KOM., M.ENG ., PH.D.
DOSEN PEMBIMBING II
A B D U L MUNIF, S.KO M. , M. S C.
2. Latar Belakang, Rumusan Masalah, Batasan Masalah,
Pendahuluan Tujuan dan Manfaat
Gambaran Umum Alur Kerja, Use Case
Uji Coba Uji Coba Fungsionalitas
3. Latar Belakang Rumusan Masalah Batasan Masalah Tujuan & Manfaat
Permasalahan yang Dihadapi :
Banyak Iklan
Situs penyedia berita tidak memiliki search
engine
Membutuhkan browser untuk akses berita
4. Latar Belakang Rumusan Masalah Batasan Masalah Tujuan & Manfaat
Aplikasi yang mampu melakukan pencarian berita yang dapat mengatasi permasalahan yang didapat
jika menggunakan situs penyedia berita konvensional
•Bagaimana cara mengambil materi berita pada situs penyedia berita
•Bagaimana cara pengiriman pesan dari server ke client
•Algoritma apa yang sesuai untuk pencarian berita
5. Latar Belakang Rumusan Masalah Batasan Masalah Tujuan & Manfaat
• Device Client dengan Server terhubung pada jaringan yang sama
• Hanya untuk berita berbahasa Indonesia
• Situs penyedia berita menggunakan situs milik detikcom
• Tidak membahas mengenai keamanan pada sistem
6. Latar Belakang Rumusan Masalah Batasan Masalah Tujuan & Manfaat
Tujuan Pembuatan Aplikasi
Membangun sistem yang dapat mengambil informasi dari situs di internet secara terdan menyimpan
informasi tersebut ke dalam database server
Membangun sistem yang dapat membuat komputer dengan perangkat smartphone yang saling
terhubung dalam jaringan saling berkomunikasi melakukan pengiriman pesan menggunakan agen
Melakukan pencarian terhadap berita menggunakan metode pencarian TF-IDF dan Vector Space Model.
Manfaat
Membantu memudahkan pengguna dalam menemukan berita pada situs penyedia berita
8. Alur Kerja Use Case
Sumber Berita didapat dari RSS Situs Penyedia Berita Detikcom
9. Alur Kerja Use Case
System
Ganti konfigurasi host port
Ganti konfigurasi jumlah hasil berita
Terhubung ke agent server
Search Berita
Pengguna
Cek berita terbaru
Pengirim berita
Baca isi berita
Tanggal terbit berita
Judul berita
Hapus hubungan dengan agent server
Isi berita
14. Kesimpulan
Aplikasi dapat mengimplementasikan kerangka kerja JSOUP untuk melakukan proses
pengambilan data dari situs penyedia berita di internet, kerangka kerja JADE untuk melakukan
proses komunikasi antar perangkat server dengan client.
Metode Convix Stripping Stemmer dapat diimplementasikan pada aplikasi untuk melakukan
proses pengambilan kata dasar / stemming pada data berita untuk kalimat berbahasa Indonesia.
Metode TF-IDF digunakan untuk mencari nilai bobot untuk setiap data berita, kemudian untuk
mendapatkan hasil yang lebih akurat digunakan metode Vector Space Model untuk mengatasi
masalah jika terdapat lebih dari satu dokumen yang memiliki nilai bobot yang sama.
Saran
Melakukan pencarian berita ke banyak situs penyedia berita lainnya
Mengembangkan metode stemming sehingga mampu melakukan proses stemming untuk berita
berbahasa selain Indonesia, dan dengan tingkat keakuratan yang lebih tinggi.
Mengembangkan metode pencarian untuk mendapatkan waktu pencarian yang lebih cepat.
15. 1. Caire, Giovanni. 2009. Jade Tutorial Jade Programming For Beginners, Telecom
Italia S.p.A.
2. Jsoup Java HTML Parser, with best of DOM, CSS, and jquery http://jsoup.org/
dikunjungi pada Maret 2012.
3. Asian J., 2007. Effective Techniques for Indonesian Text Retrieval, PhD Thesis
School of Computer Science and Information Technology RMIT University Australia.
4. Herwansyah, Adit. 2009. Aplikasi Pengkategorian Dokumen dan Pengukuran
Tingkat Similaritas Dokumen
5. Menggunakan Kata Kunci pada Dokumen Penulisan Ilmiah Universitas
Gunadarma, Universitas Gunadarma.
6. The Classic Vector Space Model http://miislita.com/term-vector/term-vector-
3.html/ dikunjungi pada Mei 2012
16. Agen CS Stemmer TF-IDF Vector Space Model
Agen adalah program yang melakukan suatu proses yang telah ditentukan ketika menerima suatu
perintah yang akan mengaktifkan proses tersebut.
Agen bekerja secara autonomous / independen dalam suatu lingkungan
Agen bisa diatur untuk terus melakukan proses tanpa henti, berhenti pada interval waktu tertentu,
atau berhenti ketika sudah menyelesaikan tugasnya
17. Agen CS Stemmer TF-IDF Vector Space Model
Perbedaan Komunikasi Client – Server biasa dengan Komunikasi Agen
Agen
Client - Server
Agen
Request
Request
Client Client Server
Server Response
Response
Agen
18. Agen CS Stemmer TF-IDF Vector Space Model
Metode stemming untuk Bahasa Indonesia yang diperkenalkan oleh Jelita Asian
Stemming dengan cara menghilangkan awalan dan akhiran, kemudian mencocokkan
dengan kata dasar pada kamus kata dasar bahasa Indonesia
Melakukan urutan stemming mulai dari penghilangan awalan terlebih dahulu, kemudian akhiran