Apache Solr untuk membuat aplikasi Search Engine sendiri

Posted: 12 Desember 2011 in Peminatan Software Engineering, Pemrograman Web, PHP, Rekayasa Perangkat Lunak, Teknik Informatika

Pendahuluan

Sebagai pendahuluan kita baca dulu, apa itu Apache Solr dari blog http://bengkeljava.posterous.com/apache-solr.

Apa itu solr? dapet dari situ resminya http://lucene.apache.org/solr/ sih ini katanya : “Solr is the popular, blazing fast open source enterprise search platform from the Apache Lucene project. Its major features include powerful full-text search, hit highlighting, faceted search, dynamic clustering, database integration, rich document (e.g., Word, PDF) handling, and geospatial search. Solr is highly scalable, providing distributed search and index replication, and it powers the search and navigation features of many of the world’s largest internet sites.”. Kalau bingung ngartiinnya (saya juga agak bingung tuh bacanya baru dapet tadi 😀 ) saya jelasin pake pengalaman saya pake solr nya aja deh. Kalau udah pada tau lucene, gampangnya solr ini servernya dari lucene : “Lucene is an open source, high-performance text search engine library. Solr can be described succinctly as the server-ization of Lucene.”.  Solr ini salah satu fungsinya ngebantu kita dalam pencarian data(fitur full-text search dan indexing), ketika kita punya banyak sekali document dan kesulitan untuk melakukan pencarian pada document tersebut bisa menggunakan solr agar lebih mudah. Fungsi – fungsi yang lain, bisa ngebantu dalam klasifikasi (fitur more like this), faceting, dll.

Mungkin ada yang bertanya – tanya, kok ga pake “database biasa”/RDBMS aja kayak postgre, oracle , dll? Kata ebook yang saya baca sih gini, perbedaan utamanya adalah solr atau lucene menggunakan satu table tanpa ada dukungan relasi antar table berbeda dengan RDBMS pada umumnya. Aneh memang, tapi katanya dengan cara itu indexing akan berisi data yang mendukung pencarian bukan malah berisi data yang akan dicari. Pada database umumnya kita melakukan pencarian dengan menggunakan suatu substring, misalkan SELECT * FROM anyTable WHERE anyField LIKE ‘%Books%’ hasilnya bisa ‘MyBooks’ atau ‘CookBooks’, dengan menggunakan solr bisa didapatkan bentuk lain dari kata tersebut misalnya book:singular, bahkan phonetic(sounds of human speech) matches mungkin dilakukan. Dengan ada nya kemampuan pemberian skor pada hasil pencarian, solr bukan hanya menampilkan hasil berdasarkan kata yang cocok tetapi juga terurut berdasarkan berapa banyak kata yang cocok dengan pencarian yang dilakukan atau skoring berdasarkan faktor – faktor lain.

Daripada makin bingung(yang ngejelasinnya yang bingung maksudnya :D), kita coba aja langsung.

1.       Pastikan java (minimal jre) sudah terinstall.
2.       Downloading solr, akses http://apache.the.net.id/lucene/solr/3.3.0/ . download file yang dirasa paling cocok untuk operating system anda.
3.       Extract file hasil download.
4.       Secara default solr akan running pada port 8983, untuk mengubahnya ada pada file etc/jetty.xml , cari SystemProperty dengan name jetty.port.
5.       Execute file start.jar , pada command prompt/terminal dapat dilakukan dengan java -jar start.jar
6.    Akses http://localhost:8983/solr/admin/ untuk memastikan apakah solr berjalan dengan benar. Coba click tombol search dibawah text area query. Pada saat pertama kali running data pada solr akan kosong, karena memang kita belum melakukan input apa pun.
7.       Pada folder example/exampledocs terdapat post.jar untuk mengisi document – document dummy yang dipersiapkan solr untuk kita melakukan beberapa experiment. Execute post.jar. lalu lakukan kembali search.

Ok, seharusnya ketika mencoba melakukan search ‘solr’ terdapat beberapa document yang muncul sebagai result. Kalau sudah berhasil sampai situ berarti solr nya sudah berhasil di install.

Buku-buku penunjang

Buku penunjang untuk belajar apache solr bisa didownload di www.torrentku.com. Untuk mendownload buku aslinya kita bisa menggunakan software torrent klien seperti utorrent, atau vuze untuk mengeksekusi file torrent yang didapat dari http://www.torrentku.com tadi. Saya sengaja memilih torrent sebagai sarana berbagi file karena, kemungkinan file tersebut korup sangat kecil. 
Selanjutnya kita akan membahas salah satu buku yaitu yang berjudul Apache Solr 3 Enterprise Search server.
Apache Solr 3
Bersambung di posting berikutnya …
 
Iklan

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout /  Ubah )

Foto Google+

You are commenting using your Google+ account. Logout /  Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout /  Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout /  Ubah )

Connecting to %s