PERBANDINGAN CLUSTERING BASED ON FREQUENT WORD SEQUENCE (CFWS) DAN K-MEANS UNTUK PENGELOMPOKAN DOKUMEN BERBAHASA INDONESIA

Novita Rizky Widyawati, - (2010) PERBANDINGAN CLUSTERING BASED ON FREQUENT WORD SEQUENCE (CFWS) DAN K-MEANS UNTUK PENGELOMPOKAN DOKUMEN BERBAHASA INDONESIA. S1 thesis, Universitas Pendidikan Indonesia.

[img] Text
s_d545_060696_chapter1.pdf

Download (259kB)
[img] Text
s_d545_060696_chapter2.pdf
Restricted to Staf Perpustakaan

Download (796kB)
[img] Text
s_d545_060696_chapter3.pdf

Download (318kB)
[img] Text
s_d545_060696_chapter4.pdf
Restricted to Staf Perpustakaan

Download (317kB)
[img] Text
s_d545_060696_chapter5.pdf

Download (247kB)
[img] Text
s_d545_060696_bibliography.pdf

Download (254kB)
Official URL: httpl://repositery.upi.edu

Abstract

Meningkatnya jumlah dokumen elektonik berbahasa Indonesia membuat pengelompokan dokumen (Clustering Document) menjadi hal yang penting. Pengelompokan dokumen diperlukan agar memudahkan pengguna menemukan dokumen yang diinginkan dengan memilih satu kelompok yang memiliki dokumen yang diinginkan pengguna tersebut. Penelitian ini membahas dan membandingkan pengelompokan dokumen dengan algoritma Clustering Based on Frequent Word Sequence (CFWS) dan K-Means. Kedua algoritma tersebut merupakan algoritma untuk clustering dokumen sehingga tidak memerlukan data pelatihan dalam mengelompokan dokumen. Pengujian dilakukan dengan menghitung akurasi dan kemurnian hasil cluster masing-masing algoritma. Akurasi dan kemurnian cluster ditentukan dengan tingginya nilai F-Measure dan Purity yang dihitung berdasarkan dokumen yang telah dikelompokan secara manual. Hasil menunjukan bahwa nilai F-Measure dan Purity cluster K-Means lebih tinggi daripada nilai F-Measure dan Purity cluster CFWS. Hal tersebut membuktikan bahwa algoritma K-Means tepat digunakan untuk pengelompokan dokumen berbahasa Indonesia.

Item Type: Thesis (S1)
Additional Information: ID SINTA Dosen Pembimbing : Yudi Wibisono : 260167 Jajang Kusnendar : 5989839
Uncontrolled Keywords: CLUSTERING BASED ON FREQUENT WORD SEQUENCE (CFWS)
Subjects: Q Science > QA Mathematics
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer
Depositing User: Imas Aulia
Date Deposited: 22 Sep 2023 02:03
Last Modified: 22 Sep 2023 02:03
URI: http://repository.upi.edu/id/eprint/107369

Actions (login required)

View Item View Item