Pengaruh AdaBoost pada Peningkatan Akurasi Naïve Bayes dalam Klasifikasi Gangguan Kepribadian Klaster B Pada Generasi Z
DOI:
https://doi.org/10.30656/protekinfo.v12i2.10696Keywords:
Naive Bayes, AdaBoost, Personality Disorders, Generation Z, Text ClassificationAbstract
Intisari — Perkembangan teknologi informasi mendorong munculnya kebutuhan untuk memahami pola perilaku pengguna media sosial, terutama Generasi Z. Penelitian ini berfokus pada klasifikasi gangguan kepribadian klaster B, yang meliputi Borderline, Antisosial, Histrionik, dan Narsistik, menggunakan data dari media sosial X (sebelumnya Twitter). Algoritma Naïve Bayes digunakan sebagai dasar klasifikasi, yang kemudian diperkuat dengan teknik ensemble AdaBoost untuk meningkatkan akurasi pada data yang kompleks dan tidak seimbang. Penelitian ini menggunakan pendekatan SEMMA (Sample, Explore, Modify, Model, Assess) untuk menangani 13.805 data teks. Proses preprocessing melibatkan case folding, tokenizing, stopword removal, dan stemming, diikuti dengan ekstraksi fitur menggunakan TF-IDF. Evaluasi model menggunakan akurasi, presisi, recall, dan F1-score. Hasil menunjukkan bahwa kombinasi Naïve Bayes dan AdaBoost secara signifikan meningkatkan kinerja klasifikasi dibandingkan model Naïve Bayes murni. Penelitian ini diharapkan dapat menjadi kontribusi terhadap pengembangan sistem deteksi dini kesehatan mental berbasis media sosial.
Kata Kunci — Naïve Bayes, AdaBoost, Generasi Z, media sosial X, gangguan kepribadian, klasifikasi teks.
Abstract — The advancement of information technology has influenced communication patterns among Generation Z, who are highly active on social media platforms. This study focuses on the classification of Cluster B personality disorders, including Borderline, Antisocial, Histrionic, and Narcissistic disorders, using textual data from the X platform (formerly Twitter). The Naïve Bayes algorithm was employed as the primary classification method and enhanced with the AdaBoost ensemble technique to address the complexity and imbalance of the data. The SEMMA (Sample, Explore, Modify, Model, Assess) methodology was used to handle 13,805 text datasets. Preprocessing included case folding, tokenizing, stopword removal, and stemming, followed by feature extraction using TF-IDF. The model was evaluated based on accuracy, precision, recall, and F1-score metrics. The results showed that the combination of Naïve Bayes and AdaBoost significantly improved classification performance compared to the pure Naïve Bayes model. This research contributes to the development of early detection systems for mental health disorders through social media analysis.
Keywords — Naïve Bayes, AdaBoost, Generation Z, X social media, personality disorders, text classification.
Downloads
Published
Issue
Section
License

ProtekInfo : (Jurnal Pengembangan Riset dan Observasi Teknik Informatika)Â Â http://e-jurnal.lppmunsera.org/index.php/ProTekInfo is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.







