Penerapan Metode K-Means Clustering dan Principal Component Analysis (PCA) untuk Pengelompokan Provinsi di Indonesia Berdasarkan Indikator Pendidikan
Abstract
Penelitian ini bertujuan untuk mengategorikan provinsi-provinsi di Indonesia berdasarkan indikator-indikator pendidikan, dengan harapan memberikan gambaran menyeluruh dan berbasis data mengenai kondisi pendidikan. Latar belakang studi ini beranjak dari adanya kesenjangan tingkat pendidikan di berbagai wilayah yang membutuhkan analisis mendalam dengan pendekatan data mining. Data yang digunakan diperoleh dari Badan Pusat Statistik (BPS) yang mencakup sejumlah indikator pendidikan, seperti rata-rata lama bersekolah, angka partisipasi kasar (APK), angka partisipasi murni (APM), angka partisipasi sekolahan (APS), serta persentase penduduk yang tidak pernah atau belum mengenyam pendidikan. Pendekatan yang diterapkan dalam penelitian ini adalah Principal Component Analysis (PCA) untuk reduksi dimensi dan K-Means Clustering untuk pengelompokan data. Langkah-langkah penelitian mencakup preprocessing data, normalisasi dengan menggunakan StandardScaler, reduksi dimensi melalui PCA, dan clustering dengan K-Means. Temuan dari penelitian ini menunjukkan bahwa dua komponen utama dari PCA mampu menerangkan hingga 79% variasi dalam data, sehingga bermanfaat dalam menyederhanakan dataset yang ada. Proses pengelompokan menghasilkan tiga kelompok provinsi dengan karakteristik pendidikan yang bervariasi, yaitu kategori tinggi, menengah, dan rendah. Penilaian menggunakan silhouette score mengindikasikan bahwa model ini memiliki kualitas pengelompokan yang baik. Temuan dari penelitian ini diharapkan dapat memberikan kontribusi dalam membantu pengambilan kebijakan pendidikan yang lebih tepat serta menjadi landasan untuk penelitian selanjutnya dengan menambahkan variabel yang lebih luas.
Downloads
References
R. Rianti et al., “Penerapan PCA dan Algoritma Clustering untuk Analisis Mutu Perguruan Tinggi di LLDIKTI Wilayah IV,” vol. 18, 2024.
I. A. Naya, “Penerapan Algoritma K- means Cliustering Untuk Segmentasi Penyakit Daun Mangga,” 2025.
S. Dewi and M. A. I. Pakereng, “Implementasi principal component analysis pada k-means untuk klasterisasi tingkat pendidikan penduduk kabupaten semarang,” vol. 8, no. 4, pp. 1186–1195, 2023.
F. A. Statistik, M. Nur, and H. Tri, “Klasterisasi Kabupaten / Kota di Provinsi Kalimantan Barat Berdasarkan Rasio Guru dengan Murid di Tingkat SD , SMA , dan SMA Serta IPM Tahun 2022 Menggunakan Metode K-Means Clustering,” vol. 3, no. 1, pp. 42–50, 2023.
N. S. Putri and M. N. Hayati, “Pengelompokan Kabupaten/Kota di Kalimantan Berdasarkan Indikator Pendidikan Menggunakan Metode K-Means dengan Optimasi Principal Component Analysis Grouping Regencies/Cities in Kalimantan Based on Educational Indicators Used K-Means Method with Principal Component Analysis Optimization,” vol. 15, no. November, pp. 128–138, 2024, doi: 10.30872/eksponensial.v15i2.1373.
G. W. and T. H. Robert Tibshirani, “Estimating the number of clusters in a data set via the gap statistic.”
K. Dbscan, “Analisis Perbandingan Silhouette dengan Elbow pada Algoritma,” 2025, doi: 10.47002/metik.v9i1.1027.
Y. Dalva, H. Pehlivan, O. I. Hatipoglu, C. Moran, and A. Dundar, “Image-to-Image Translation with Disentangled Latent Vectors for Face Editing,” pp. 1–12.
F. Susy, “Unflavored Leptogenesis and Neutrino Masses in,” no. 5.
P. Martinez-azcona and A. Kundu, “Stochastic Operator Variance: an observable to diagnose noise and scrambling,” pp. 1–14.
L. Angeles, “Estimating Ejecta Masses of Stripped Envelope Supernovae Using Late-Time Light Curves,” 2023.
R. Molina, N. Ikeno, and E. Oset, “Reply to ‘Comment on Sequential Single-pion Production Explaining the dibaryon d ∗ (2380) peak,’” no. 2380, pp. 1–4, 2023.
R. Str, M. Schaller, K. Worthmann, J. Berberich, and F. Allg, “SafEDMD : A Koopman-based data-driven controller design framework for nonlinear dynamical systems ⋆,” no. 2021, 2022.
A. Mandal, “A characterization of orthogonal permutative matrices of”.
R. Gong et al., “ARNOLD : A Benchmark for Language-Grounded Task Learning With Continuous States in Realistic 3D Scenes”.
M. Jourdan, E. Kaufmann, M. Jourdan, and I. Fr, “Dealing with Unknown Variances in Best-Arm Identification,” vol. 201, pp. 1–74, 2023.
N. N. Putriwijaya and N. Yudistira, “Learning-Augmented K-Means Clustering Using Dimensional Reduction,” pp. 1–17, 2021.
R. Capuani and O. C. Feb, “a pursuit evasion-like game,” pp. 1–26, 2023.
C. St, “JPerceiver: Joint Perception Network for Depth, Pose and Layout Estimation in Driving Scenes,” pp. 1–26, 2008.
J. Shah, G. Nambiar, A. V Gorshkov, and V. Galitski, “Quantum spin ice in three-dimensional Rydberg atom arrays,” no. 1, pp. 1–33, 2024.
X. Ma, J. Zhang, X. Feng, and C. Zhang, “perturbed convection diffusion problem on Shishkin,” pp. 1–33.
N. Ramsey, “Some symbolic dynamics in real quadratic fields with applications to inhomogeneous minima,” vol. 1, pp. 1–10.
N. Roth and A. L. Goodwin, “disordered crystals Pre-print , second version May 17th 2023,” pp. 1–34, 2023.
Copyright (c) 2026 Clinton Lumbantoruan, Dyah Ayu Megawaty

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.








