KLASTERISASI PROVINSI DI INDONESIA MENGGUNAKAN METODE K-MEANS DENGAN CENTROID LINKAGE BERDASARKAN JUMLAH TENAGA KESEHATAN TAHUN 2023

    Barqy Muhammad Ilhan, - and Dadan Dasari, - and Dewi Rachmatin, - (2025) KLASTERISASI PROVINSI DI INDONESIA MENGGUNAKAN METODE K-MEANS DENGAN CENTROID LINKAGE BERDASARKAN JUMLAH TENAGA KESEHATAN TAHUN 2023. S1 thesis, Universitas Pendidikan Indonesia.

    Abstract

    Klasterisasi adalah metode untuk mengelompokkan data berdasarkan kemiripan antarunit data tanpa adanya label awal yang disediakan. Metode ini merupakan salah satu teknik unsupervised learning dalam Knowledge Discovery in Databases (KDD). Dalam konteks jumlah tenaga kesehatan secara geografis, teknik ini dapat digunakan untuk mengelompokkan wilayah berdasarkan karakteristiknya masing-masing. Penelitian ini bertujuan untuk mengelompokkan provinsi-provinsi di Indonesia berdasarkan jumlah tenaga kesehatan pada tahun 2023 dengan menggunakan metode K-Means, di mana pemilihan pusat awal (centroid) dilakukan dengan metode Centroid Linkage. Dataset yang digunakan mencakup 12 variabel kuantitatif diskrit terkait jenis-jenis tenaga kesehatan di tiap provinsi di Indonesia. Hasil analisis menunjukkan bahwa terdapat dua klaster terbaik. Klaster pertama (Klaster 1) terdiri dari 34 provinsi yang membentuk kelompok yang relatif homogen dengan jumlah tenaga kesehatan yang cenderung rendah, nilai di bawah rata-rata pada semua variabel, serta tingkat variasi data yang lebih rendah dibandingkan dengan klaster kedua. Klaster kedua (Klaster 2) mencakup 4 provinsi dengan jumlah tenaga kesehatan yang lebih banyak, nilai di atas rata-rata untuk seluruh variabel yang dianalisis, serta tingkat variasi yang lebih tinggi. Berdasarkan nilai koefisien silhouette rata-rata, hasil klasterisasi menunjukkan skor sebesar 0,73, dengan skor individu sebesar 0,77 untuk Klaster 1 dan 0,46 untuk Klaster 2. Analisis terhadap profil klaster menunjukkan bahwa kedua klaster memiliki profil yang tidak sejajar, yang mengindikasikan adanya perbedaan karakteristik yang signifikan di antara keduanya. Hasil ini diharapkan dapat menjadi dasar bagi pengambilan kebijakan yang lebih tepat dalam rangka mendorong distribusi tenaga kesehatan yang lebih merata di seluruh wilayah Indonesia.

    Clustering is a method of grouping data based the on similarity within the record without any prior labels provided and it is a technique of an unsupervised learning under Knowledge Discovery in Databases (KDD). In the context of geographical health workforce distribution planning, this technique can then be used to cluster regions according to their characteristics. The purpose of this study is to group provinces in Indonesia based on the number of health workers in 2023 using the K-Means method with initial centroids selected using the Centroid Linkage method. The dataset contains 12 discrete quantitative variables that indicate the different types of health workers by province in Indonesia. The analysis showed two optimal clusters. The first cluster (Cluster 1) is a relatively homogenous group of 30 provinces that have comparatively low numbers of health workers, with below-average values on all variables and lower variability of data compared to the second cluster. The 2nd cluster represents 4 provinces with many health workers, above-average values for each of the variables assessed, and greater variability. We note that in terms of the average silhouette coefficient, the clustering result has the average of 0.73, with individual scores of 0.77 and 0.46 for cluster 1 and 2, respectively. Analysis of the profiles suggests that the two clusters have nonparallel profiles, indicating that the two clusters have substantially different characteristics. The results are anticipated to facilitate better policy making for fairer distribution of health workers population proportion across Indonesia.

    [thumbnail of S_MAT_2102924_Title.pdf] Text
    S_MAT_2102924_Title.pdf

    Download (472kB)
    [thumbnail of S_MAT_2102924_Chapter1.pdf] Text
    S_MAT_2102924_Chapter1.pdf

    Download (80kB)
    [thumbnail of S_MAT_2102924_Chapter2.pdf] Text
    S_MAT_2102924_Chapter2.pdf
    Restricted to Staf Perpustakaan

    Download (288kB) | Request a copy
    [thumbnail of S_MAT_2102924_Chapter3.pdf] Text
    S_MAT_2102924_Chapter3.pdf

    Download (382kB)
    [thumbnail of S_MAT_2102924_Chapter4.pdf] Text
    S_MAT_2102924_Chapter4.pdf
    Restricted to Staf Perpustakaan

    Download (323kB) | Request a copy
    [thumbnail of S_MAT_2102924_Chapter5.pdf] Text
    S_MAT_2102924_Chapter5.pdf

    Download (57kB)
    [thumbnail of S_MAT_2102924_Appendix.pdf] Text
    S_MAT_2102924_Appendix.pdf
    Restricted to Staf Perpustakaan

    Download (179kB) | Request a copy
    Official URL: https://repository.upi.edu/
    Item Type: Thesis (S1)
    Additional Information: ID SINTA Dosen Pembimbing Dadan Dasari: 6000619 Dewi Rachmatin: 5975775
    Uncontrolled Keywords: Klasterisasi, Tenaga Kesehatan, K-Means, Centroid Linkage, Analisis Profil Clustering, Health workers, K-Means, Centroid Linkage, Profile Analysis
    Subjects: Q Science > QA Mathematics
    Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Matematika - S1 > Program Studi Matematika (non kependidikan)
    Depositing User: Barqy Muhammad Ilhan
    Date Deposited: 06 May 2025 07:23
    Last Modified: 06 May 2025 07:23
    URI: http://repository.upi.edu/id/eprint/132995

    Actions (login required)

    View Item View Item