IMPLEMENTASI METODE MULTINOMIAL NAIVE BAYES UNTUK MENDETEKSI KICAUAN YANG MENGANDUNG UJARAN KEBENCIAN PADA DATA TWITTER BAHASA INDONESIA

    Umar Syahid Aulia Rahman, - (2020) IMPLEMENTASI METODE MULTINOMIAL NAIVE BAYES UNTUK MENDETEKSI KICAUAN YANG MENGANDUNG UJARAN KEBENCIAN PADA DATA TWITTER BAHASA INDONESIA. S1 thesis, Universitas Pendidikan Indonesia.

    Abstract

    Pada Peneliltian ini kami membahas klasifikasi ujaran kebencian pada data kicauan (Twitter) dalam bahasa Indonesia dimana pada penelitian ini kami membangun dataset ujaran kebencian pada kicauan bahasa Indonesia dan melakukan pengklasifikasian dengan mengimplementasikan algoritma Multinomial Naive Bayes dengan menggunakan ekstraksi fitur term frequency – inverse document frequency (TF-IDF). Pada penelitian kami melakukan beberapa konfigurasi dalam modifikasi data training untuk mengatasi imbalanced dataset yaitu dengan menggunakan metode random oversampling dan random undersampling. Dari eksperimen tersebut kami melakukan evaluasi menggunakan confusion matrix dan didapatkan hasil implementasi metode Multinomial Naive Bayes dengan modifikasi data training menggunakan random oversampling dengan rasio data testing 10% memiliki hasil yang paling bagus dengan fmeasure sebesar 0.5307.

    [thumbnail of S_KOM_1405681_Title.pdf] Text
    S_KOM_1405681_Title.pdf

    Download (308kB)
    [thumbnail of S_KOM_1405681_Chapter1.pdf] Text
    S_KOM_1405681_Chapter1.pdf

    Download (118kB)
    [thumbnail of S_KOM_1405681_Chapter2.pdf] Text
    S_KOM_1405681_Chapter2.pdf
    Restricted to Staf Perpustakaan

    Download (529kB)
    [thumbnail of S_KOM_1405681_Chapter3.pdf] Text
    S_KOM_1405681_Chapter3.pdf

    Download (286kB)
    [thumbnail of S_KOM_1405681_Chapter4.pdf] Text
    S_KOM_1405681_Chapter4.pdf
    Restricted to Staf Perpustakaan

    Download (1MB)
    [thumbnail of S_KOM_1405681_Chapter5.pdf] Text
    S_KOM_1405681_Chapter5.pdf

    Download (97kB)
    [thumbnail of S_KOM_1405681_Appendix.pdf] Text
    S_KOM_1405681_Appendix.pdf
    Restricted to Staf Perpustakaan

    Download (235kB)
    Official URL: http://repository.upi.edu
    Item Type: Thesis (S1)
    Additional Information: No Panggil : S KOM UMA i-2020; NIM : 1405681
    Uncontrolled Keywords: Dataset Construction, Hate Speech Classification, Imbalanced Dataset, Multinomial Naive Bayes Classifier, Term Frequency Inverse Document Frequency
    Subjects: L Education > L Education (General)
    Q Science > QA Mathematics > QA75 Electronic computers. Computer science
    Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer
    Depositing User: Umar Syahid Aulia Rahman
    Date Deposited: 11 Sep 2020 03:45
    Last Modified: 11 Sep 2020 03:45
    URI: http://repository.upi.edu/id/eprint/53029

    Actions (login required)

    View Item View Item