Perbaikan algoritme Lafzi

Setelah hampir 2 tahun ditinggalkan, akhirnya sempat juga mengutak-atik kembali Lafzi. Kali ini dilakukan perbaikan terhadap algoritme untuk pemberian skor dan metode sorotan pada hasil pencarian. Tujuannya yaitu untuk memperbaiki hasil pencarian. Perhatikan gambar berikut, yakni Lafzi yang menggunakan algoritme lama untuk mencari lafal “wal yatalattof” (kata pada pertengahan Al-Quran).

Lafzi algoritme lama

Terlihat hasil yang “menyebar” tidak teratur, bahkan lafal yang dicari pun tidak ditemukan. Bandingkan dengan Lafzi yang menggunakan algoritme baru pada gambar berikut.

Lafzi algoritme baru

Tepat sasaran, alhamdulillah :)

Algoritme baru yang dimaksud yaitu perubahan cara menghitung skor keterurutan, yang tadinya menggunakan metode longest-increasing subsequence menjadi metode longest-contiguous subsequence. Metode yang baru ini sebenarnya lebih simpel, sayangnya tidak dari dulu kepikirannya. Metode ini juga mendukung fungsi sorotan hasil pencarian yang lebih terkelompok.

Selain itu, skor kemunculan yang tadinya hanya menggunakan posisi kemunculan pertama query pada dokumen, sekarang seluruh posisi kemunculan juga diperhitungkan. Ini juga ada kaitannya dengan penggunaan metode longest-contiguous subsequence.

Demikian sedikit laporan perbaikan untuk kali ini. Silakan cek Lafzi pada alamatnya: http://apps.cs.ipb.ac.id/lafzi.