Implementasi Feature Selection Dan Pembobotan TFIDF Pada Klasifikasi Tweets Informasi Kehilangan Dengan Naive Bayes

    Burhanudin, - (2022) Implementasi Feature Selection Dan Pembobotan TFIDF Pada Klasifikasi Tweets Informasi Kehilangan Dengan Naive Bayes. S1 thesis, Universitas Pendidikan Indonesia.

    Abstract

    Media sosial Twitter merupakan tempat berbagi informasi ke sesama pengguna dengan bentuk informasi teks. Salah satu informasi yang banyak dibagikan adalah informasi kehilangan. Informasi kehilangan dapat diklasifikasikan berdasarkan objeknya, yaitu kehilangan barang dan dokumen, kehilangan kendaraan, orang hilang, dan bukan informasi kehilangan. Tahapan yang dilakukan untuk mengklasifikasikan informasi kehilangan pada penelitian ini adalah melakukan preprocessing data, menghitung bobot TF, menghitung bobot fitur menggunakan metode feature selection Information Gain, Chi-Square, dan Document Frequency, menyeleksi fitur berdasarkan threshold, menghitung bobot TFIDF, dan melakukan klasifikasi menggunakan metode Naive Bayes. Penelitian ini akan menguji perbandingan akurasi berdasarkan kombinasi pembobotan dan metode feature selection yang digunakan. Hasil pengujian menunjukkan bahwa kombinasi metode Chi-Square – TFIDF dan Chi-Square - TF dengan penggunaan fitur sebesar 20% dari total fitur memiliki akurasi paling tinggi sebesar 85,09%. Hasil ini menunjukkan bahwa penggunaan feature selection dapat meningkatkan akurasi pada klasifikasi data teks. Sedangkan penggunaan bobot TFIDF secara keseluruhan memiliki hasil yang kurang baik jika dibandingkan dengan penggunaan bobot TF.

    [thumbnail of S_KOM_1504286_Title.pdf] Text
    S_KOM_1504286_Title.pdf

    Download (816kB)
    [thumbnail of S_KOM_1504286_Chapter1.pdf] Text
    S_KOM_1504286_Chapter1.pdf

    Download (244kB)
    [thumbnail of S_KOM_1504286_Chapter2.pdf] Text
    S_KOM_1504286_Chapter2.pdf
    Restricted to Staf Perpustakaan

    Download (616kB)
    [thumbnail of S_KOM_1504286_Chapter3.pdf] Text
    S_KOM_1504286_Chapter3.pdf

    Download (305kB)
    [thumbnail of S_KOM_1504286_Chapter4.pdf] Text
    S_KOM_1504286_Chapter4.pdf
    Restricted to Staf Perpustakaan

    Download (683kB)
    [thumbnail of S_KOM_1504286_Chapter5.pdf] Text
    S_KOM_1504286_Chapter5.pdf

    Download (222kB)
    [thumbnail of S_KOM_1504286_Appendix.pdf] Text
    S_KOM_1504286_Appendix.pdf
    Restricted to Staf Perpustakaan

    Download (1MB)
    Official URL: http://repository.upi.edu
    Item Type: Thesis (S1)
    Additional Information: Link Google Scholar: https://scholar.google.com/citations?user=R20SJKYAAAAJ&hl=en&oi=ao https://scholar.google.com/citations?user=61vphZ0AAAAJ&hl=en&oi=ao ID SINTA Dosen Pembimbing: Yaya Wihardi : 5994413 Rosa Ariani Sukamto : 5974496
    Uncontrolled Keywords: Informasi Kehilangan, Feature Selection, Information Gain, Chi-Square, Document Frequency, TFIDF, Naïve Bayes
    Subjects: L Education > L Education (General)
    Q Science > QA Mathematics > QA75 Electronic computers. Computer science
    Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer
    Depositing User: Burhanudin
    Date Deposited: 14 Sep 2022 02:37
    Last Modified: 14 Sep 2022 02:37
    URI: http://repository.upi.edu/id/eprint/80363

    Actions (login required)

    View Item View Item