IMPLEMENTASI ALGORITMA CONDITIONAL RANDOM FIELDS UNTUK PART OF SPEECH TAGGING BAHASA MADURA

Authors

  • Rizky Sulaiman University of Muhammadiyah Malang
  • Setio Basuki University of Muhammadiyah Malang

DOI:

https://doi.org/10.30656/jsii.v12i1.9989

Abstract

Penelitian ini berfokus pada penerapan Conditional Random Fields (CRF) untuk Part of Speech (POS) Tagging dalam bahasa Madura. Mengingat keterbatasan sumber daya pemrosesan bahasa alami (NLP) untuk bahasa daerah, khususnya bahasa Madura, studi ini bertujuan untuk mengembangkan model POS tagging yang akurat. Dataset yang digunakan berisi 73.051 kata yang dikumpulkan dari berbagai sumber, seperti media sosial, artikel, dan percakapan sehari-hari. Data ini melalui tahapan pra-pemrosesan, termasuk pembersihan, tokenisasi, dan pelabelan manual dengan kategori POS yang mencakup 15 jenis tag. Model CRF dilatih menggunakan fitur morfologis dan kontekstual untuk mengenali pola linguistik dalam bahasa Madura. Model ini mencapai akurasi yang kompetitif sebesar 95%, yang menunjukkan kemampuannya dalam menangkap pola linguistik bahasa Madura secara efektif. Model ini berkinerja baik dalam kategori POS umum seperti kata benda (NN), kata kerja (VB), dan kata sifat (JJ), dengan F1-score sebesar 0,96 untuk kata benda dan 0,89 untuk kata kerja. Namun, tantangan muncul pada kategori yang lebih jarang seperti Foreign Word (FW) dan Adverb (RB), terutama disebabkan oleh variasi dialek dan penggunaan kata serapan. Penelitian ini memberikan kontribusi penting dalam pengembangan sumber daya NLP untuk bahasa daerah dan dapat digunakan dalam berbagai aplikasi seperti penerjemahan otomatis, asisten virtual, serta pelestarian bahasa Madura. Penelitian mendatang dimasa depan memperluas dataset dan mengeksplorasi model berbasis neural network untuk lebih meningkatkan kinerja POS tagging.

 

Kata Kunci: Pemrosesan Bahasa Alami, Conditional Random Fields, POS Tagging, Bahasa Madura, Pelestarian Bahasa Daerah.

References

[1] R. Suryadi, “Penerapan Teknologi Pengolahan Bahasa Alami dalam Asisten Virtual Berbahasa Indonesia,” Jurnal Informatika Indonesia, vol. 10, no. 2, pp. 45-58, 2020.

[2] T. Ramadhan, “Tagging Part of Speech Bahasa Indonesia Menggunakan Metode Conditional Random Fields (CRF),” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 12, no. 1, pp. 20-30, 2021.

[3] D. Pratama, “Analisis POS Tagging pada Bahasa Indonesia dengan Algoritma CRF,” Jurnal Penelitian Teknologi Informasi dan Komunikasi, vol. 14, no. 3, pp. 35-45, 2019.

[4] A. Nurhadi, “Pengembangan Alat NLP untuk Bahasa Daerah di Indonesia,” Jurnal Linguistik Indonesia, vol. 36, no. 2, pp. 67-80, 2021.

[5] S. Kertawijaya, “Dialek Bahasa Madura: Kajian Morfologis dan Sintaksis,” Jurnal Bahasa dan Sastra Daerah Indonesia, vol. 39, no. 4, pp. 112-125, 2020.

[6] I. Trisnawati, “Analisis Perbedaan Dialek Bahasa Madura dalam Penerapan Teknologi NLP,” Jurnal Linguistik Terapan Indonesia, vol. 33, no. 1, pp. 75-89, 2020.

[7] M. Hasan, “Pengumpulan Dataset untuk Pengembangan POS Tagging Bahasa Daerah di Indonesia,” Jurnal Teknologi Informasi, vol. 25, no. 1, pp. 100-112, 2021.

[8] F. Mulyadi, “Model Conditional Random Fields untuk Pengolahan Teks Bahasa Indonesia,” Jurnal Informatika Indonesia, vol. 15, no. 2, pp. 40-52, 2019.

[9] A. Nurdin, “Evaluasi Kinerja Model POS Tagging dengan Conditional Random Fields (CRF),” Jurnal Penelitian Teknologi Informasi dan Komunikasi, vol. 13, no. 2, pp. 123-134, 2020.

[10] N. Kurniawan, “Pelestarian Bahasa Daerah melalui Teknologi NLP: Studi Kasus Bahasa Madura,” Jurnal Bahasa dan Teknologi Informasi, vol. 8, no. 3, pp. 89-102, 2021.

[11] A. Rahman, “Tantangan dan Prospek Pengembangan NLP untuk Bahasa Daerah di Indonesia,” Jurnal Informatika Terapan, vol. 16, no. 2, pp. 80-92, 2022.

[12] I. Wibisono, “Pemanfaatan Teknologi untuk Pelestarian Bahasa Daerah di Indonesia,” Jurnal Penelitian Bahasa dan Sastra Daerah, vol. 34, no. 1, pp. 120-130, 2021.

[13] A. S. Nugroho, “Penerapan Conditional Random Fields pada Tugas POS Tagging Bahasa Daerah,” Jurnal Teknologi Bahasa Indonesia, vol. 18, no. 3, pp. 55-67, 2022.

[14] R. Fitriani, "Implementasi Teknologi AI pada Bahasa Daerah di Indonesia," Jurnal Teknologi Informasi, vol. 17, no. 1, pp. 90-100, 2022.

[15] S. Kurniawan, “Perkembangan Teknologi NLP untuk Bahasa Minoritas di Indonesia,” Jurnal Informatika Nusantara, vol. 12, no. 4, pp. 44-56, 2021.

Downloads

Published

2025-03-21

Issue

Section

Articles