PENERAPAN ALGORITMA K-MEANS PADA CLUSTERING BERITA BERBAHASA INDONESIA

Rubi Henjaya, - (2010) PENERAPAN ALGORITMA K-MEANS PADA CLUSTERING BERITA BERBAHASA INDONESIA. S1 thesis, Universitas Pendidikan Indonesia.

[img] Text
s_d545_0608534_table_of_contents.pdf

Download (263kB)
[img] Text
s_d545_0608534_chapter1.pdf

Download (254kB)
[img] Text
s_d545_0608534_chapter2.pdf
Restricted to Staf Perpustakaan

Download (1MB)
[img] Text
s_d545_0608534_chapter3.pdf

Download (348kB)
[img] Text
s_d545_0608534_chapter4.pdf
Restricted to Registered users only

Download (791kB)
[img] Text
s_d545_0608534_chapter5.pdf

Download (242kB)
[img] Text
s_d545_0608534_bibliography.pdf

Download (244kB)
Official URL: http://repository.upi.edu

Abstract

Informasi berita yang tidak terkontrol dapat menyebabkan efek information overload bagi pembaca. Akibatnya, pengguna dapat terjebak dalam arus berita yang melimpah. Masalah tersebut dapat diatasi dengan mengelompokkan berita sesuai peristiwa yang diulasnya. Document clustering adalah salah satu metode yang dapat digunakan untuk mengelompokkan dokumen secara otomatis. Dalam penelitian ini algoritma clustering yang digunakan untuk pengelompokan dokumen berita adalah algoritma K-Means. Algoritma K-Means merupakan algoritma dasar yang mudah dan dapat dengan cepat melakukan pemusatan data (convergence) pada proses clustering. Dalam penelitian ini representasi dokumen yang digunakan adalah model ruang vektor. Penelitian dilakukan untuk mengimplementasikan penerapan algoritma K-Means dalam mengelompokkan berita berbahasa Indonesia. Selain itu, kinerja algoritma K-Means dengan berbagai masukan dibandingkan, yakni antara dokumen berita yang tidak diklasifikasi terlebih dahulu dan dokumen berita yang telah diklasifikasi terlebih dahulu. Hasil penelitian ini adalah suatu prototype perangkat lunak yang dapat mengimplementasikan algoritma K-Means dengan fungsi utamanya mengelompokkan berita berbahasa Indonesia. Hasil Eksperimen memperlihatkan bahwa hasil cluster terbaik dibangun dengan penambahan proses klasifikasi sebelum proses clustering dengan nilai Purity=0,53 dibandingkan dengan tidak diklasifikasi sebelumnya yang memiliki nilai purity=0,32. Sehingga dataset masukan yang diberikan adalah dokumen berita yang telah diklasifikasi terlebih dahulu karena memiliki tingkat kemurnian cluster yang lebih tinggi dibandingkan dengan dokumen berita yang tidak diklasifikasi terlebih dahulu.

Item Type: Thesis (S1)
Additional Information: id sinta dosen pembimbing: Yudi Wibisono: 260167 Jajang Kusnendar: 5989839
Uncontrolled Keywords: ALGORITMA K-MEANS, CLUSTERING BERITA BERBAHASA INDONESIA
Subjects: L Education > L Education (General)
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer
Depositing User: Erni Alipiyani
Date Deposited: 18 Oct 2023 07:12
Last Modified: 18 Oct 2023 07:12
URI: http://repository.upi.edu/id/eprint/110557

Actions (login required)

View Item View Item