Implementasi Feature Selection Dan Pembobotan TFIDF Pada Klasifikasi Tweets Informasi Kehilangan Dengan Naive Bayes

Burhanudin, - (2022) Implementasi Feature Selection Dan Pembobotan TFIDF Pada Klasifikasi Tweets Informasi Kehilangan Dengan Naive Bayes. S1 thesis, Universitas Pendidikan Indonesia.

[img] Text
S_KOM_1504286_Title.pdf

Download (816kB)
[img] Text
S_KOM_1504286_Chapter1.pdf

Download (244kB)
[img] Text
S_KOM_1504286_Chapter2.pdf
Restricted to Staf Perpustakaan

Download (616kB)
[img] Text
S_KOM_1504286_Chapter3.pdf

Download (305kB)
[img] Text
S_KOM_1504286_Chapter4.pdf
Restricted to Staf Perpustakaan

Download (683kB)
[img] Text
S_KOM_1504286_Chapter5.pdf

Download (222kB)
[img] Text
S_KOM_1504286_Appendix.pdf
Restricted to Staf Perpustakaan

Download (1MB)
Official URL: http://repository.upi.edu

Abstract

Media sosial Twitter merupakan tempat berbagi informasi ke sesama pengguna dengan bentuk informasi teks. Salah satu informasi yang banyak dibagikan adalah informasi kehilangan. Informasi kehilangan dapat diklasifikasikan berdasarkan objeknya, yaitu kehilangan barang dan dokumen, kehilangan kendaraan, orang hilang, dan bukan informasi kehilangan. Tahapan yang dilakukan untuk mengklasifikasikan informasi kehilangan pada penelitian ini adalah melakukan preprocessing data, menghitung bobot TF, menghitung bobot fitur menggunakan metode feature selection Information Gain, Chi-Square, dan Document Frequency, menyeleksi fitur berdasarkan threshold, menghitung bobot TFIDF, dan melakukan klasifikasi menggunakan metode Naive Bayes. Penelitian ini akan menguji perbandingan akurasi berdasarkan kombinasi pembobotan dan metode feature selection yang digunakan. Hasil pengujian menunjukkan bahwa kombinasi metode Chi-Square – TFIDF dan Chi-Square - TF dengan penggunaan fitur sebesar 20% dari total fitur memiliki akurasi paling tinggi sebesar 85,09%. Hasil ini menunjukkan bahwa penggunaan feature selection dapat meningkatkan akurasi pada klasifikasi data teks. Sedangkan penggunaan bobot TFIDF secara keseluruhan memiliki hasil yang kurang baik jika dibandingkan dengan penggunaan bobot TF.

Item Type: Thesis (S1)
Additional Information: Link Google Scholar: https://scholar.google.com/citations?user=R20SJKYAAAAJ&hl=en&oi=ao https://scholar.google.com/citations?user=61vphZ0AAAAJ&hl=en&oi=ao ID SINTA Dosen Pembimbing: Yaya Wihardi : 5994413 Rosa Ariani Sukamto : 5974496
Uncontrolled Keywords: Informasi Kehilangan, Feature Selection, Information Gain, Chi-Square, Document Frequency, TFIDF, Naïve Bayes
Subjects: L Education > L Education (General)
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer
Depositing User: Burhanudin
Date Deposited: 14 Sep 2022 02:37
Last Modified: 14 Sep 2022 02:37
URI: http://repository.upi.edu/id/eprint/80363

Actions (login required)

View Item View Item