PENERAPAN ALGORITMA K-MEANS PADA CLUSTERING BERITA BERBAHASA INDONESIA

    Rubi Henjaya, - (2010) PENERAPAN ALGORITMA K-MEANS PADA CLUSTERING BERITA BERBAHASA INDONESIA. S1 thesis, Universitas Pendidikan Indonesia.

    Abstract

    Informasi berita yang tidak terkontrol dapat menyebabkan efek information overload bagi pembaca. Akibatnya, pengguna dapat terjebak dalam arus berita yang melimpah. Masalah tersebut dapat diatasi dengan mengelompokkan berita sesuai peristiwa yang diulasnya. Document clustering adalah salah satu metode yang dapat digunakan untuk mengelompokkan dokumen secara otomatis.

    Dalam penelitian ini algoritma clustering yang digunakan untuk pengelompokan dokumen berita adalah algoritma K-Means. Algoritma K-Means merupakan algoritma dasar yang mudah dan dapat dengan cepat melakukan pemusatan data (convergence) pada proses clustering. Dalam penelitian ini representasi dokumen yang digunakan adalah model ruang vektor.

    Penelitian dilakukan untuk mengimplementasikan penerapan algoritma K-Means dalam mengelompokkan berita berbahasa Indonesia. Selain itu, kinerja algoritma K-Means dengan berbagai masukan dibandingkan, yakni antara dokumen berita yang tidak diklasifikasi terlebih dahulu dan dokumen berita yang telah diklasifikasi terlebih dahulu.

    Hasil penelitian ini adalah suatu prototype perangkat lunak yang dapat mengimplementasikan algoritma K-Means dengan fungsi utamanya mengelompokkan berita berbahasa Indonesia.

    Hasil Eksperimen memperlihatkan bahwa hasil cluster terbaik dibangun dengan penambahan proses klasifikasi sebelum proses clustering dengan nilai Purity=0,53 dibandingkan dengan tidak diklasifikasi sebelumnya yang memiliki nilai purity=0,32. Sehingga dataset masukan yang diberikan adalah dokumen berita yang telah diklasifikasi terlebih dahulu karena memiliki tingkat kemurnian cluster yang lebih tinggi dibandingkan dengan dokumen berita yang tidak diklasifikasi terlebih dahulu.

    [thumbnail of s_d545_0608534_table_of_contents.pdf] Text
    s_d545_0608534_table_of_contents.pdf

    Download (263kB)
    [thumbnail of s_d545_0608534_chapter1.pdf] Text
    s_d545_0608534_chapter1.pdf

    Download (254kB)
    [thumbnail of s_d545_0608534_chapter2.pdf] Text
    s_d545_0608534_chapter2.pdf
    Restricted to Staf Perpustakaan

    Download (1MB)
    [thumbnail of s_d545_0608534_chapter3.pdf] Text
    s_d545_0608534_chapter3.pdf

    Download (348kB)
    [thumbnail of s_d545_0608534_chapter4.pdf] Text
    s_d545_0608534_chapter4.pdf
    Restricted to Registered users only

    Download (791kB)
    [thumbnail of s_d545_0608534_chapter5.pdf] Text
    s_d545_0608534_chapter5.pdf

    Download (242kB)
    [thumbnail of s_d545_0608534_bibliography.pdf] Text
    s_d545_0608534_bibliography.pdf

    Download (244kB)
    Official URL: http://repository.upi.edu
    Item Type: Thesis (S1)
    Additional Information: id sinta dosen pembimbing: Yudi Wibisono: 260167 Jajang Kusnendar: 5989839
    Uncontrolled Keywords: ALGORITMA K-MEANS, CLUSTERING BERITA BERBAHASA INDONESIA
    Subjects: L Education > L Education (General)
    Q Science > QA Mathematics > QA75 Electronic computers. Computer science
    Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer
    Depositing User: Erni Alipiyani
    Date Deposited: 18 Oct 2023 07:12
    Last Modified: 18 Oct 2023 07:12
    URI: http://repository.upi.edu/id/eprint/110557

    Actions (login required)

    View Item View Item