SILABIFIKASI KATA BAHASA KOREA DALAM AKSARA LATIN BERBASIS ATURAN DAN MODEL DETERMINISTIC FINITE AUTOMATA
DOI:
https://doi.org/10.21460/jutei.2018.21.77Keywords:
Syllabification, Transliteration, Hangeul, Korean, Finite State Automata, Rule-basedAbstract
Transliterasi atau alih aksara otomatis masih menjadi topik penelitian yang menarik. Transliterasi aksara Korea telah menjadi topik penelitian dalam otomasi konversi antara aksara Hangul menuju aksara Latin. Penelitian-penelitian yang telah dilakukan memberikan hasil akurasi 72,2% dengan pendekatan statistik dan 54,9% menggunakan pendekatan Extended Markov Models untuk transliterasi dari Hangul ke Latin.
Penelitian ini mengenai transliterasi kata bahasa Korea yang dituliskan menggunakan aksara Latin (romanisasi) untuk dialih aksarakan ke dalam aksara Hangul. Topik ini dipilih untuk membantu para pembelajar bahasa, karena sebagian besar pembelajar bahasa Korea memulai dengan aksara Latin terlebih dahulu. Pendekatan yang dipilih adalah membangun model kemungkinan sekuens vokal dan konsonan sebagai penyusun kata, dan membangun model sekuens suku kata yang memungkinkan. Model ini akan dibangun menggunakan prinsip Finite State Automata (FSA) agar tidak ememrlukan pelatihan. 100 kata acak dalam bahasa Korea digunakan sebagai data uji.
Hasil pengujian awal menunjukkan keberhasilan hanya sebesar 40% karena sejumlah kekurangan dalam metode pelabelan konsonan, sehingga terdapat konsonan yang tidak telabeli sebagai intial atau final. Serangkaian aturan kemudian ditambahkan untuk mengatasi hal ini dan menghasilkan tingkat keberhasilan segmentasi dan transliterasi sebesar 92%. Hasil ini kemudian dianalisis kembali dan ditemukan bahwa rangkaian konsonan tertentu dapat menyebabkan kesalahan silabifikasi pada posisi tertentu dalam kata. Aturan tambahan berikutnya dapat memperbaiki hal ini dan menghasilkan tingkat akurasi 99% dalam mentransliterasikan kata bahasa Korea dalam aksara Latin ke dalam bentuk suku kata aksara Hangul.
References
[2] Anon. History of Hangul – Part I. https://zkorean.com/hangul/history_of_hangul. Diakses tanggal 25 Mei 2016.
[3] Anon. Abugida. http://www.cs.mcgill.ca/~rwest/link-suggestion/wpcd_2008-09_augmented/wp/a/Abugida.htm. Diakses tanggal 25 Mei 2016.
[4] Trombley, G., Bullen, R., Bong, S., Ham, M. 2015. Korean From Zero! From Zero, LLC., Henderson.
[5] Omae, H., Tsuji, K., Kageura, K., Imai, M., Anzai, Y. Extraction of Compound Word Traslations from Non-parallel Japanese-French Text in World Wide Web. http://slis.sakura.ne.jp/. Diakses tanggal 25 Mei 2016.
[6] Goldberg, Y., Elhadad, M. 2008. Identification of Transliterated Foreign Words in Hebrew Script. Computational Linguistics and Intelligent Text Processing Volume 4919 of the series Lecture Notes in Computer Science, hal. 466-477.
[7] Brar, D., dan Kaur, R. 2014. A Review of Transliteration system from English to Punjabi. International Journal of Advanced Research in Computer Science and Software Engineering Vol. 4, ed. 7, Juli 2014
[8] Lee, J.S. dan Choi, K-S. 2014. English to Korean Statistical Transliteration for Information Retrieval. Department of Computer Science, Korea Advanced Institute of Science and Technology, Taejon
[9] Jung, S.Y, Hong, S.L, Paek, E. 2000. An English to Korean Transliteration Model of Extended Markov Window. Information Technology Lab., LG Electronics Institute of Technology, Seoul
[10] Lee, C. Y. 2004. Essential Grammar For Korean as a Second Language
[11] McCune, G.M., Reischauer, E.O. 1939. Romanization of The Korean Language. Transactions of the Korea Branch of the Royal Asiatic Society Vol. XXIX, Seoul
[12] South Korean Ministry of Culture & Tourism. Romanization of Korean (2000). https://web.archive.org/web/20070916025652/ http://www.korea.net/korea/kor_loca.asp?code=A020303. Diakses pada 25 Mei 2016 dari tautan arsip.
[13] Mohri, M. 1997. Finite-State Transducers in Language and Speech Processing. Computational Linguistics Vol. 23 issue 2, Juni 1997, hal. 269-311.
[14] Gribkoff, E. 2013. Finite State Transducers. Catatan Pengajaran: University of California, Davis.
[15] Mogensen, T. Æ. 2010. Basics of Compiler Design. University of Copenhagen, Copenhagen, Denmark.
Downloads
Published
How to Cite
Issue
Section
License
Authors who publish articles in JUTEI agree on the following rules:
1. The author grants non exclusive royalty free rights, and is willing to publish articles online and complete (full access). With such rights JUTEI reserves the right to save, transfers, manages in various forms, maintains and publishes articles while keeping the author's name as the copyright owner.
2. Each author contained in the article has contributed fully to the substance and intellectual, and is accountable to the public. If in the future there is a copyright infringement notification then this will be responsibility of the author, not JUTEI.