ANALISIS KLASTER PADA DATASET BESAR DENGAN ALGORITMA CLARANS (Studi Kasus : Tingkat Kemiskinan di 221 Kota/Kabupaten di Indonesia Tahun 2020)

Fitri Nurkholifah, - (2021) ANALISIS KLASTER PADA DATASET BESAR DENGAN ALGORITMA CLARANS (Studi Kasus : Tingkat Kemiskinan di 221 Kota/Kabupaten di Indonesia Tahun 2020). S1 thesis, Universitas Pendidikan Indonesia.

[img] Text
S_MAT_1700014_Title.pdf

Download (769kB)
[img] Text
S_MAT_1700014_Chapter1.pdf

Download (329kB)
[img] Text
S_MAT_1700014_Chapter2.pdf
Restricted to Staf Perpustakaan

Download (609kB)
[img] Text
S_MAT_1700014_Chapter3.pdf

Download (684kB)
[img] Text
S_MAT_1700014_Chapter4.pdf
Restricted to Staf Perpustakaan

Download (903kB)
[img] Text
S_MAT_1700014_Chapter5.pdf

Download (240kB)
[img] Text
S_MAT_1700014_Appendix.pdf
Restricted to Staf Perpustakaan

Download (544kB)
Official URL: http://repository.upi.edu

Abstract

Analisis klaster merupakan salah satu teknik multivariat yang mempunyai tujuan utama yaitu mengelompokkan objek – objek pengamatan ke dalam beberapa klaster/kelompok berdasarkan karakteristik yang dimilikinya, sehingga objek – objek yang berada di klaster yang sama memiliki tingkat kemiripan yang lebih tinggi dibandingkan dengan objek yang berada di klaster yang berbeda. Secara umum, metode analisis klaster dibagi menjadi dua yaitu metode hierarki dan partisi. Metode partisi dapat dibagi menjadi dua yaitu k-means dan k-medoid (PAM/CLARA). Kelemahan metode - metode tersebut yaitu kurang efektif dan efisien dalam melakukan analisis klaster pada dataset besar. Untuk mengatasi permasalahan ini maka digunakanlah algoritma CLARANS (Clustering Large Application based on RANdomized Search). CLARANS merupakan algoritma yang mengkombinasikan teknik sampling dan algoritma PAM. Pada studi kasus tingkat kemiskinan di 221 kota/kabupaten di Indonesia tahun 2020, algoritma CLARANS terbukti efektif dan efisien dalam melakukan analisis klaster pada dataset besar. Hal ini terlihat dari kualitas hasil klasterisasi yang cukup baik dengan nilai silhouette coefficient sebesar 0,6009 untuk jumlah klaster sebanyak 4 klaster. Setiap klaster memiliki jumlah anggota dan pusat klaster yang berbeda - beda dengan total cost sebesar 366,4794. Karakteristik yang terbentuk dari setiap klaster yaitu klaster 1 memiliki tingkat kemiskinan tertinggi, klaster 2 memiliki tingkat kemiskinan cukup tinggi, klaster 3 dan 4 masing - masing memiliki tingkat kemiskinan sedang dan rendah. Karena klaster 1 didominasi oleh kota/kabupaten di provinsi Nusa Tenggara Timur, maka kota/kabupaten di provinsi tersebut memerlukan perhatian yang lebih dibandingkan dengan kota/kabupaten di provinsi yang lain. Kata Kunci : Analisis Klaster, Sampling, PAM, CLARANS, Kemiskinan Cluster analysis is one of the multivariate techniques that has the main goal of grouping objects of observation into several clusters/groups based on their characteristics, so that objects in the same cluster have a higher similarity than objects in different cluster. Cluster analysis method are divided into two, hierarchical and partition. Partition method are k-means and k-medoids (PAM/CLARA). The Weakness of these algorithms are the ineffective and efficient in performing cluster analysis on large datasets. Therefore, to solve this problem the CLARANS (Clustering Large Application based on RANdomized Search) is used. CLARANS is an algorithm that combine sampling technique and PAM algorithm. In a case study of poverty rates in 221 cities/districts in Indonesia on 2020, the CLARANS algorithm has proven to be effective and efficient in performing cluster analysis on large datasets. This can be seen from the quality of the clustering results which are good enough with a silhouette coefficient value 0,6009 for 4 clusters. Each cluster has a different number of members and medoids with total cost 366,4794. The characteristics formed from each cluster are that cluster 1 has the highest proverty rate, cluster 2 has a rather high poverty rate, clusters 3 and 4 each have moderate and low poverty rates. Because cluster 1 is dominated by cities/districts in the Province of East Nusa Tenggara, so the cities/districts in that province require more attention than cities/districts in other provinces. Keywords : Cluster Analysis, Sampling, PAM, CLARANS, Poverty

Item Type: Thesis (S1)
Uncontrolled Keywords: Analisis Klaster, Sampling, PAM, CLARANS, Kemiskinan
Subjects: L Education > L Education (General)
Q Science > QA Mathematics
Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Jurusan Pendidikan Matematika > Program Studi Matematika (non kependidikan)
Depositing User: Fitri Nurkholifah
Date Deposited: 30 Aug 2021 07:21
Last Modified: 30 Aug 2021 07:21
URI: http://repository.upi.edu/id/eprint/64474

Actions (login required)

View Item View Item