SILABIFIKASI KATA BAHASA KOREA DALAM AKSARA LATIN BERBASIS ATURAN DAN MODEL DETERMINISTIC FINITE AUTOMATA

Authors

  • (*) Rouly Doharma Sihite,  Program Studi Manajemen Informatika, STMIK Widuri
  • Aditya Wikan Mahastama,  Prodi Informatika, Universitas Kristen Duta Wacana

(*) Corresponding Author

DOI:

https://doi.org/10.21460/jutei.2018.21.77

Keywords:

Syllabification, Transliteration, Hangeul, Korean, Finite State Automata, Rule-based

Abstract

Transliterasi atau alih aksara otomatis masih menjadi topik penelitian yang menarik. Transliterasi aksara Korea telah menjadi topik penelitian dalam otomasi konversi antara aksara Hangul menuju aksara Latin. Penelitian-penelitian yang telah dilakukan memberikan hasil akurasi 72,2% dengan pendekatan statistik dan 54,9% menggunakan pendekatan Extended Markov Models untuk transliterasi dari Hangul ke Latin.

Penelitian ini mengenai transliterasi kata bahasa Korea yang dituliskan menggunakan aksara Latin (romanisasi) untuk dialih aksarakan ke dalam aksara Hangul. Topik ini dipilih untuk membantu para pembelajar bahasa, karena sebagian besar pembelajar bahasa Korea memulai dengan aksara Latin terlebih dahulu. Pendekatan yang dipilih adalah membangun model kemungkinan sekuens vokal dan konsonan sebagai penyusun kata, dan membangun model sekuens suku kata yang memungkinkan. Model ini akan dibangun menggunakan prinsip Finite State Automata (FSA) agar tidak ememrlukan pelatihan. 100 kata acak dalam bahasa Korea digunakan sebagai data uji.

Hasil pengujian awal menunjukkan keberhasilan hanya sebesar 40% karena sejumlah kekurangan dalam metode pelabelan konsonan, sehingga terdapat konsonan yang tidak telabeli sebagai intial atau final. Serangkaian aturan kemudian ditambahkan untuk mengatasi hal ini dan menghasilkan tingkat keberhasilan segmentasi dan transliterasi sebesar 92%. Hasil ini kemudian dianalisis kembali dan ditemukan bahwa rangkaian konsonan tertentu dapat menyebabkan kesalahan silabifikasi pada posisi tertentu dalam kata. Aturan tambahan berikutnya dapat memperbaiki hal ini dan menghasilkan tingkat akurasi 99% dalam mentransliterasikan kata bahasa Korea dalam aksara Latin ke dalam bentuk suku kata aksara Hangul.

References

[1] Kharusi, N. S., Salman, A. 2011. The English Transliteration of Place Names in Oman. Journal of Academic and Applied Studies Vol. 1(3) September 2011, hal. 1–27.
[2] Anon. History of Hangul – Part I. https://zkorean.com/hangul/history_of_hangul. Diakses tanggal 25 Mei 2016.
[3] Anon. Abugida. http://www.cs.mcgill.ca/~rwest/link-suggestion/wpcd_2008-09_augmented/wp/a/Abugida.htm. Diakses tanggal 25 Mei 2016.
[4] Trombley, G., Bullen, R., Bong, S., Ham, M. 2015. Korean From Zero! From Zero, LLC., Henderson.
[5] Omae, H., Tsuji, K., Kageura, K., Imai, M., Anzai, Y. Extraction of Compound Word Traslations from Non-parallel Japanese-French Text in World Wide Web. http://slis.sakura.ne.jp/. Diakses tanggal 25 Mei 2016.
[6] Goldberg, Y., Elhadad, M. 2008. Identification of Transliterated Foreign Words in Hebrew Script. Computational Linguistics and Intelligent Text Processing Volume 4919 of the series Lecture Notes in Computer Science, hal. 466-477.
[7] Brar, D., dan Kaur, R. 2014. A Review of Transliteration system from English to Punjabi. International Journal of Advanced Research in Computer Science and Software Engineering Vol. 4, ed. 7, Juli 2014
[8] Lee, J.S. dan Choi, K-S. 2014. English to Korean Statistical Transliteration for Information Retrieval. Department of Computer Science, Korea Advanced Institute of Science and Technology, Taejon
[9] Jung, S.Y, Hong, S.L, Paek, E. 2000. An English to Korean Transliteration Model of Extended Markov Window. Information Technology Lab., LG Electronics Institute of Technology, Seoul
[10] Lee, C. Y. 2004. Essential Grammar For Korean as a Second Language
[11] McCune, G.M., Reischauer, E.O. 1939. Romanization of The Korean Language. Transactions of the Korea Branch of the Royal Asiatic Society Vol. XXIX, Seoul
[12] South Korean Ministry of Culture & Tourism. Romanization of Korean (2000). https://web.archive.org/web/20070916025652/ http://www.korea.net/korea/kor_loca.asp?code=A020303. Diakses pada 25 Mei 2016 dari tautan arsip.
[13] Mohri, M. 1997. Finite-State Transducers in Language and Speech Processing. Computational Linguistics Vol. 23 issue 2, Juni 1997, hal. 269-311.
[14] Gribkoff, E. 2013. Finite State Transducers. Catatan Pengajaran: University of California, Davis.
[15] Mogensen, T. Æ. 2010. Basics of Compiler Design. University of Copenhagen, Copenhagen, Denmark.

Published

2018-08-08

How to Cite

[1]
R. D. Sihite and A. W. Mahastama, “SILABIFIKASI KATA BAHASA KOREA DALAM AKSARA LATIN BERBASIS ATURAN DAN MODEL DETERMINISTIC FINITE AUTOMATA”, JUTEI, vol. 2, no. 1, pp. 75–85, Aug. 2018.