K-Means dan Data Mining Tools: Strategi Efektif untuk Menganalisis Siswa Putus Sekolah

  • Ade Christian Universitas Bina Sarana Informatika
  • Hariyanto Hariyanto Universitas Bina Sarana Informatika
  • Ahmad Yani Universitas Bina Sarana Informatika
  • Sumanto Sumanto Universitas Bina Sarana Informatika
Keywords: K-Means, Data Mining, Klasterisasi, RapidMiner, Orange, Siswa Putus Sekolah, Weka

Abstract

Pendidikan memiliki peran penting dalam membangun sumber daya manusia yang berkualitas, namun permasalahan putus sekolah masih menjadi tantangan serius, terutama di tingkat Sekolah Menengah Kejuruan (SMK). Untuk mengatasi masalah ini, penelitian ini membandingkan tiga aplikasi data mining, yaitu RapidMiner, Orange, dan Weka, dalam mengelompokkan siswa putus sekolah menggunakan algoritma K-Means. Data yang digunakan diperoleh dari berbagai sumber dan diproses melalui tahapan pengujian, penerapan algoritma K-Means, serta perbandingan hasil klasterisasi. Hasil penelitian menunjukkan bahwa RapidMiner memiliki akurasi tertinggi sebesar 86%, diikuti oleh Orange dengan 80%, dan Weka dengan 73%. Perbedaan akurasi ini menunjukkan bahwa setiap aplikasi memiliki keunggulan dan keterbatasan masing-masing dalam pemrosesan data dan pengelompokan siswa berdasarkan pola tertentu. Dari hasil perbandingan ini, RapidMiner terbukti lebih optimal dalam menghasilkan klaster yang lebih akurat dan stabil dibandingkan dengan dua aplikasi lainnya. Meskipun penelitian ini menunjukkan hasil yang signifikan, masih terdapat beberapa keterbatasan, seperti jumlah dataset yang terbatas dan penggunaan satu algoritma saja (K-Means). Oleh karena itu, penelitian selanjutnya dapat menggunakan dataset yang lebih besar dan beragam, serta mengeksplorasi algoritma lain, seperti DBSCAN atau Hierarchical Clustering, untuk meningkatkan kualitas analisis. Selain itu, integrasi teknik machine learning yang lebih kompleks juga direkomendasikan guna meningkatkan akurasi prediksi. Hasil penelitian ini diharapkan dapat membantu lembaga pendidikan dalam mengidentifikasi pola siswa berisiko putus sekolah, sehingga dapat digunakan sebagai dasar dalam pengambilan keputusan dan strategi intervensi pendidikan yang lebih efektif.

Kata Kunci: Data Mining; K-Means, Klasterisasi; RapidMiner; Orange; Weka; Siswa Putus Sekolah.

 

References

M. Madani and R. Risfaisal, “Perilaku Sosial Anak Putus Sekolah,” Equilib. J. Pendidik., vol. 4, no. 2, pp. 184–193, 2017, doi: 10.26618/equilibrium.v4i2.500.

M. L. Y. Yoridi and M. A. I. Pakereng, “Klasifikasi Anak Berpotensi Putus Sekolah dengan Metode Naïve Bayes Di Kabupaten Manokwari,” J. Sains Komput. Inform., vol. 7, no. 2, pp. 968–976, 2023, [Online]. Available: https://tunasbangsa.ac.id/ejurnal/index.php/jsakti/article/view/700/675

E. Alyahyan and D. Düştegör, “Predicting academic success in higher education: literature review and best practices,” Int. J. Educ. Technol. High. Educ., vol. 17, no. 1, 2020, doi: 10.1186/s41239-020-0177-7.

C. H. Cho, Y. W. Yu, and H. G. Kim, “A Study on Dropout Prediction for University Students Using Machine Learning,” Appl. Sci., vol. 13, no. 21, 2023, doi: 10.3390/app132112004.

N. Mduma, K. Kalegele, and D. Machuve, “A survey of machine learning approaches and techniques for student dropout prediction,” Data Sci. J., vol. 18, no. 1, pp. 1–10, 2019, doi: 10.5334/dsj-2019-014.

D. Kim and S. Kim, “Sustainable education: Analyzing the determinants of university student dropout by nonlinear panel data models,” Sustain., vol. 10, no. 4, pp. 1–18, 2018, doi: 10.3390/su10040954.

Laila Khoirun Nisa, Tari Fitri Ningsih, Burhanuddin Izzul Salam, F. Fauzi, and Eny Winaryati, “Clustering Model K-Means Pada Kasus Angka Putus Sekolah Tingkatan Sekolah Dasar Di Provinsi Jawa Tengah,” LogicLink, vol. 1, no. 1, pp. 13–20, 2024, doi: 10.28918/logiclink.v1i1.7793.

F. Simanjorang, R. Winanjaya, and F. Rizki, “Penerapan Algoritma K-Means Dalam Pengelompokan Rasio Angka Partisipasi Kasar di Tingkat Pendidikan Perguruan Tinggi Menurut Provinsi,” J. Terap. Inform. Nusant., vol. 2, no. 7, pp. 454–459, 2021.

M. Norshahlan, H. Jaya, and R. Kustini, “Penerapan Metode Clustering Dengan Algoritma K-means Pada Pengelompokan Data Calon Siswa Baru,” J. Sist. Inf. Triguna Dharma (JURSI TGD), vol. 2, no. 6, p. 1042, 2023, doi: 10.53513/jursi.v2i6.9148.

E. Y. T. P. Dewi and I. Kamila, “Pengelompokan Wilayah Berdasarkan Faktor Pendukung Pendidikan Dengan Jumlah Sekolah Dan Jumlah Guru Menggunakan Algoritma K-Means,” Interval J. Ilm. Mat., vol. 2, no. 1, pp. 1–12, 2022, doi: 10.33751/interval.v2i1.5161.

S. Oktarian, S. Defit, and Sumijan, “Clustering Students’ Interest Determination in School Selection Using the K-Means Clustering Algorithm Method,” J. Inf. dan Teknol., vol. 2, pp. 68–75, 2020, doi: 10.37034/jidt.v2i3.65.

Ainurrohma, “Akurasi Algoritma Klasifikasi pada Software Rapidminer dan Weka,” Prism. Pros. Semin. Nas. Mat., vol. 4, pp. 493–499, 2021, [Online]. Available: https://journal.unnes.ac.id/sju/index.php/prisma/

S. Informasi et al., “Perbandingan Penggunaan Aplikasi Rapidminer Dengan Weka Untuk Penerapan Metode K-Means Clustering Pada Pengelompokan Penderita Demensia,” J. Ilm. Komputasi, vol. 18, no. 2, 2019, doi: 10.32409/jikstik.18.2.2584.

A. Surip, M. A. Pratama, I. Ali, A. R. Dikananda, and A. I. Purnamasari, “Penerapan Machine Learning menggunakan algoritma C4.5 berbasis PSO dalam Menganalisa Data Siswa Putus Sekolah,” INFORMATICS Educ. Prof. J. Informatics, vol. 5, no. 2, p. 147, 2021, doi: 10.51211/itbi.v5i2.1530.

R. Ridwan, I. Irawaty, and A. H. Momo, “Faktor Penyebab Anak Putus Sekolah (Studi di Desa Mapila Kecamatan Kabaena Utara Kabupaten Bombana),” Selami Ips, vol. 12, no. 1, p. 62, 2020, doi: 10.36709/selami.v12i1.10838.

Published
2025-01-15
How to Cite
Christian, A., Hariyanto, H., Yani, A., & Sumanto, S. (2025). K-Means dan Data Mining Tools: Strategi Efektif untuk Menganalisis Siswa Putus Sekolah. CHAIN: Journal of Computer Technology, Computer Engineering, and Informatics, 3(1), 14-26. https://doi.org/10.58602/chain.v3i1.167