PERBAIKAN METODE JARO–WINKLER DISTANCE UNTUK APPROXIMATE STRING SEARCH MENGGUNAKAN DATA TERINDEKS APLIKASI MULTI USER

Friendly Friendly

Sari


terhadap kata telah lama dikembangkan diataranya adalah metode: Hamming Distance, Jaccard Distance, Jaro Distance, Jaro-Winkler Distance, Levenshtein Distance, dan lain sebagainya. Metode tersebut digunakan dalam pembanding lexicographic untuk mencari kata yang sesuai atau mendekati kata yang dicari Dari waktu yang diperlukan untuk menghasilkan kedekatan kata, adalah suatu overhead bila dilakukan secara berulang oleh pengguna yang berbeda. Apabila metode ini diterapkan pada aplikasi berbasis multi user, maka pengguna akan merasakan waktu akses yang bertambah lama dibandingkan dengan pencarian tepat suatu kata. Untuk mengatasi terjadinya pencarian dan pemrosesan data secara berulang, pada metode Jaro-winkler diterapkan pengindeksan data hasil pencarian yang telah dihasilkan. Dari pengujian yang dilaksanakan, tampak bahwa proses pencarian kedekatan string untuk pencarian dengan kata kunci yang sama pada proses pencarian berikutnya lebih cepat antara 90-92% dibandingkan dengan pencarian dengan menggunakan metodeJaro Winkler saja. Dengan semangkin berkembangnya indeks data pencarian, akan sangat mempercepat proses pencarian terhadap data-data string yang memiliki kedekatan.

Teks Lengkap:

PDF

Referensi


G. Navarro, "A Guided Tour to Approximate String Matching," ACM Computing Surveys, vol. 33, no. 1, pp. 31-88, 2001.

Y. Rochmawati and R. Kusumaningrum, "Studi Perbandingan Algoritma Pencarian String dalam Metode Approximate String Matching untuk Identifikasi Kesalahan Pengetikan Teks," Jurnal Buana Informatika, pp. 125-134, April 2016.

K. Dressler and A.-C. N. Ngomo, "On the Efficient Execution of Bounded Jaro-Winkler Distances," 12 September 2014. [Online]. Available: http://www.semantic-web-journal.net/content/efficient-execution-bounded-jaro-winkler-distances. [Accessed 15 April 2017].

P. E. Black, "Dictionary of Algorithms and Data Structures," National Institute of Standard and Technology, 27 May 2014. [Online]. Available: https://xlinux.nist.gov/dads/HTML/jaroWinkler.html. [Accessed 15 April 2017].

I. T. Administration, "Damerau–Levenshtein distance usage,ITA's Data Services Platform," U.S. Exporting Data Authoritative , April 2017. [Online]. Available: http://developer.trade.gov/. [Accessed April 2017].

L. BOYTSOV, "Indexing Methods for Approximate Dictionary Searching: Comparative Analysis," Asociation for Computing Machinery, May 2011. [Online]. Available: http://doi.acm.org/10.1145/1963190.1963191. [Accessed 14 April 2017].

W. E. Winkler, "Overview of Record Linkage," Statistical Research Division,U.S. Census Bureau, Washington, 2006.


Refbacks

  • Saat ini tidak ada refbacks.

Komentar di artikel ini

Lihat semua komentar


pISNN : 2355 - 701X

eISNN : 2340 - 8389

Creative Commons License This journal is licensed under a Creative Commons Attribution 4.0 International License

Flag Counter