KLUSTERISASI PENYEBAB KEMATIAN DI INDONESIA DENGAN PENERAPAN  ALGORITMA K-MEANS

Agus Nursikuwagus; Suherman; Hendry  Gunawan; Ilham Alamsyah

doi:10.30656/jsii.v11i2.9276

Penulis

Agus Nursikuwagus Universitas Komputer Indonesia
Suherman Universitas Serang Raya
Hendry Gunawan Universitas Serang Raya
Ilham Alamsyah Universitas Komputer Indonesia

DOI:

https://doi.org/10.30656/jsii.v11i2.9276

Abstrak

Kasus angka kematian yang terjadi di Indonesia dapat di kelompokan dalam beberapa kategori seperti natural disaster, nonnatural disaster, dan social disaster. Pemisahan suatu instans pada dataset sering menjadi hambatan Ketika melibatkan instans yang banyak. Penemuan karakteristik yang serupa akan menjadi tantangan untuk mendapatkan kluster terbaik. Penentuan jumlah kluster yang efektif terhadap dataset yang dimiliki menjadi permasalahan lain Ketika melakukan proses kluster. Berdasarkan permasalahan dan tantangan yang diperoleh, maka untuk menjawab hal ini dilakukanlah pemodelan clustering dengan bantuan algoritma clustering. Metode yang digunakan pada pengklusteran ini adalah K-Means. Metode ini telah menjadi usulan dari berbagai penelitian yang menyatakan sukses dalam melakukan clustring. Penentuan K terbaik yaitu dengan bantuan elbow curve, dengan melihat titik elbow pada hasil generasi kurva dari dataset. Rangkaian penyelesaian penelitian ini adalah dengan mengikuti flow of process datamining yang dimulai dengan Data Preprocessing, Data modeliing, dan visualization hasil. bertujuan untuk mengetahui klusterisasi penyebab kematian di Indonesia berdasarkan kategori yang di sebutkan di atas. Dataset yang digunakan adalah sebanyak 648 instans yang diambil dari rentang 2000 â€“ 2020 mengenai kasus kematian pada 34 provinsi di Indonesia. Data preprocessing adalah melakukan cleansing data, pembersihan outlier, missing value, data transformation. Pembersihan outlier yaitu menggunakan bantuan Box Plot, sedangkan transformation menggunakan fungsi transormasi data diskrit menjadi data numerik. Pada data modelling, algoritma K-means dengan K atau banyaknya diperoleh dari hasil Elbow Curve. Selain proses clustering, penggalian pola juga dilakukan dengan metode classification yang hasilnya ditunjukan dengan akurasi sebesar 63%. Meninjau dari hasil classification, bahwa klasifikasi kematian yang berasal dari sumber sosial, tidak dapat diprediksi dengan akurat. Klasifikasi sumber kematian dari Sosial tidak berhasil dipolakan oleh mesin learning. Matrik konfusi menunjukkan hanya 55 instans yang benar untuk bencana alam, bencana non alam dan penyakit sebesar 353 yang benar, dan untuk bencana sosial tidak berhasil diprediksi. Dari hasil ini, maka dapat diperoleh tantangan baru yaitu memperbaiki akurasi dengan mempertimbangan Imbalance Class, dan Resampling yang belum digunakan pada penelitian ini.

Kata kunci: Unsupervise, clustering, K-Means, euclidean distance, elbow curve,.

Referensi

A. M. Siregar, â€œPengelompokan Bidang Laju Pertumbuhan Ekonomi Indonesia Menggunakan Algoritma K-Means,â€ Jurnal Accounting Information System (Aims), Vol. 2, No. 2, Pp. 140â€“151, 2019.

F. A. I. S. Aji, S. Achmadi, And F. X. Ariwibisono, â€œPenerapan Metode Clustering Pada Analisis Realisasi Pendapatan Asli Daerah Dengan Algoritma K-Means,â€ Jati (Jurnal Mahasiswa Teknik Informatika), Vol. 5, No. 2, Pp. 443â€“451, 2021.

R. D. Bekti, R. N. Zulfahmi, M. K. Daul, W. J. Pradnyaana, And E. Sutanta, â€œSistem Informasi Berbasis Website Untuk Pemetaan Wilayah Berdasarkan Clustering Kerentanan Kriminalitas,â€ Jurnal Informatika Teknologi Dan Sains (Jinteks), Vol. 6, No. 3, Pp. 620â€“626, 2024.

J. Li Et Al., â€œFeature Selection: A Data Perspective,â€ Acm Computing Surveys (Csur), Vol. 50, No. 6, Pp. 1â€“45, 2017.

B. Venkatesh And J. Anuradha, â€œA Review Of Feature Selection And Its Methods,â€ Cybernetics And Information Technologies, Vol. 19, No. 1, Pp. 3â€“26, 2019.

F. Juliawati, R. Buaton, And R. Saragih, â€œPengelompokan Data Mining Penerimaan Bantuan Pangan Non Tunai (Bpnt) Menggunakan Metode Clustering (Studi Kasus: Kantor Desa Payabakung Hamparan Perak),â€ Explorer (Hayward), Vol. 3, No. 2, Pp. 69â€“76, 2023.

S. S. Helma, M. Mustakim, E. Normala, And Others, â€œAnalisis Cluster Menggunakan Algoritma K-Means Pada Data Fasilitas Pelayanan Kesehatan Kota Pekanbaru,â€ In Seminar Nasional Teknologi Informasi Komunikasi Dan Industri, Pp. 131â€“137.

J. Li Et Al., â€œFeature Selection: A Data Perspective,â€ Acm Computing Surveys (Csur), Vol. 50, No. 6, Pp. 1â€“45, 2017.

A. Ahmad And L. Dey, â€œA Feature Selection Technique For Classificatory Analysis,â€ Pattern Recognit Lett, Vol. 26, No. 1, Pp. 43â€“56, 2005.

B. Venkatesh And J. Anuradha, â€œA Review Of Feature Selection And Its Methods,â€ Cybernetics And Information Technologies, Vol. 19, No. 1, Pp. 3â€“26, 2019.

A. M. Siregar, â€œPengelompokan Bidang Laju Pertumbuhan Ekonomi Indonesia Menggunakan Algoritma K-Means,â€ Jurnal Accounting Information System (Aims), Vol. 2, No. 2, Pp. 140â€“151, 2019.

F. A. I. S. Aji, S. Achmadi, And F. X. Ariwibisono, â€œPenerapan Metode Clustering Pada Analisis Realisasi Pendapatan Asli Daerah Dengan Algoritma K-Means,â€ Jati (Jurnal Mahasiswa Teknik Informatika), Vol. 5, No. 2, Pp. 443â€“451, 2021.

B. Ruhiman, A. Ramdan, And C. Juliane, â€œAlgorithm K-Means Clustering Algorithm To Classify The Level Of Legal Information Service Objectives In West Java Province: K-Means Clustering Algorithm To Classify The Level Of Legal Information Service Objectives In West Java Province,â€ Jurnal Komputer Terapan, Vol. 8, No. 1, Pp. 178â€“185, 2022.

T. Jelita, R. Buaton, And M. Simanjuntak, â€œPengelompokan Bidang Usaha Terhadap Bantuan Produktif Usaha Mikro (Bpum) Berdasarkan Wilayah Deli Serdang Menggunakan Metode Clustering K-Means (Studi Kasus: Dinas Koperasi Dan Umkm Kabupaten Deli Serdang),â€ Explorer (Hayward), Vol. 3, No. 2, Pp. 50â€“57, 2023.

H. E. Fischer, W. J. Boone, And K. Neumann, â€œQuantitative Research Designs And Approaches,â€ In Handbook Of Research On Science Education, Routledge, 2023, Pp. 28â€“59.

L. Bode Et Al., â€œStudy Designs For Quantitative Social Science Research Using Social Media,â€ 2020.

L. J. Duckett, â€œQuantitative Research Excellence: Study Design And Reliable And Valid Measurement Of Variables,â€ Journal Of Human Lactation, Vol. 37, No. 3, Pp. 456â€“463, 2021.

J. Bloomfield And M. J. Fisher, â€œQuantitative Research Design,â€ Journal Of The Australasian Rehabilitation Nurses Association, Vol. 22, No. 2, Pp. 27â€“30, 2019.

P. D. Morrell And J. B. Carroll, â€œQuantitative Study Designs,â€ In Conducting Educational Research, Brill, 2010, Pp. 175â€“186.

N. L. Anggreini And Others, â€œTeknik Clustering Dengan Algoritma K-Medoids Untuk Menangani Strategi Promosi Di Politeknik Tedc Bandung,â€ Jurnal Teknologi Informasi Dan Pendidikan, Vol. 12, No. 2, Pp. 1â€“7, 2019.

B. S. Shedthi, S. Shetty, And M. Siddappa, â€œImplementation And Comparison Of K-Means And Fuzzy C-Means Algorithms For Agricultural Data,â€ In 2017 International Conference On Inventive Communication And Computational Technologies (Icicct), 2017, Pp. 105â€“108.

D. Deng, â€œDbscan Clustering Algorithm Based On Density,â€ In 2020 7th International Forum On Electrical Engineering And Automation (Ifeea), 2020, Pp. 949â€“953.

A. Latifi-Pakdehi And N. Daneshpour, â€œDbhc: A Dbscan-Based Hierarchical Clustering Algorithm,â€ Data Knowl Eng, Vol. 135, P. 101922, 2021.

R. D. Bekti, R. N. Zulfahmi, M. K. Daul, W. J. Pradnyaana, And E. Sutanta, â€œSistem Informasi Berbasis Website Untuk Pemetaan Wilayah Berdasarkan Clustering Kerentanan Kriminalitas,â€ Jurnal Informatika Teknologi Dan Sains (Jinteks), Vol. 6, No. 3, Pp. 620â€“626, 2024.

T.-H. Huang, M. L. Huang, And K. Zhang, â€œAn Interactive Scatter Plot Metrics Visualization For Decision Trend Analysis,â€ In 2012 11th International Conference On Machine Learning And Applications, 2012, Pp. 258â€“264.

R. Ratra And P. Gulia, â€œExperimental Evaluation Of Open Source Data Mining Tools (Weka And Orange),â€ International Journal Of Engineering Trends And Technology, Vol. 68, No. 8, Pp. 30â€“35, 2020.

Z. R. Mohi, â€œOrange Data Mining As A Tool To Compare Classification Algorithms,â€ Dijlah Journal Of Sciences And Engineering, Vol. 3, No. 3, Pp. 13â€“23, 2020.

F. Juliawati, R. Buaton, And R. Saragih, â€œPengelompokan Data Mining Penerimaan Bantuan Pangan Non Tunai (Bpnt) Menggunakan Metode Clustering (Studi Kasus: Kantor Desa Payabakung Hamparan Perak),â€ Explorer (Hayward), Vol. 3, No. 2, Pp. 69â€“76, 2023.

E. Mardiani Et Al., â€œMembandingkan Algoritma Data Mining Dengan Tools Orange Untuk Social Economy,â€ Digital Transformation Technology, Vol. 3, No. 2, Pp. 686â€“693, 2023.

M. Heydarian, T. E. Doyle, And R. Samavi, â€œMlcm: Multi-Label Confusion Matrix,â€ Ieee Access, Vol. 10, Pp. 19083â€“19095, 2022.

D. KrstiniÄ‡, M. BraoviÄ‡, L. Å eriÄ‡, And D. BoÅ¾iÄ‡-Å tuliÄ‡, â€œMulti-Label Classifier Performance Evaluation with Confusion Matrix,â€ Computer Science & Information Technology, Vol. 1, Pp. 1â€“14, 2020.

J. Liang, â€œConfusion Matrix: Machine Learning,â€ Pogil Activity Clearinghouse, Vol. 3, No. 4, 2022.

K. Zhou and S. Yang, â€œEffect Of Cluster Size Distribution On Clustering: A Comparative Study Of K-Means And Fuzzy C-Means Clustering,â€ Pattern Analysis And Applications, Vol. 23, No. 1, Pp. 455â€“466, 2020.

KLUSTERISASI PENYEBAB KEMATIAN DI INDONESIA DENGAN PENERAPAN ALGORITMA K-MEANS

Penulis

DOI:

Abstrak

Referensi

Unduhan

Diterbitkan

Terbitan

Bagian

Lisensi

Terbitan Terkini

edit

template1

sertifikat

statcounter

support

indexing