Burhanudin, - (2022) Implementasi Feature Selection Dan Pembobotan TFIDF Pada Klasifikasi Tweets Informasi Kehilangan Dengan Naive Bayes. S1 thesis, Universitas Pendidikan Indonesia.
Abstract
Media sosial Twitter merupakan tempat berbagi informasi ke sesama pengguna dengan bentuk informasi teks. Salah satu informasi yang banyak dibagikan adalah informasi kehilangan. Informasi kehilangan dapat diklasifikasikan berdasarkan objeknya, yaitu kehilangan barang dan dokumen, kehilangan kendaraan, orang hilang, dan bukan informasi kehilangan. Tahapan yang dilakukan untuk mengklasifikasikan informasi kehilangan pada penelitian ini adalah melakukan preprocessing data, menghitung bobot TF, menghitung bobot fitur menggunakan metode feature selection Information Gain, Chi-Square, dan Document Frequency, menyeleksi fitur berdasarkan threshold, menghitung bobot TFIDF, dan melakukan klasifikasi menggunakan metode Naive Bayes. Penelitian ini akan menguji perbandingan akurasi berdasarkan kombinasi pembobotan dan metode feature selection yang digunakan. Hasil pengujian menunjukkan bahwa kombinasi metode Chi-Square – TFIDF dan Chi-Square - TF dengan penggunaan fitur sebesar 20% dari total fitur memiliki akurasi paling tinggi sebesar 85,09%. Hasil ini menunjukkan bahwa penggunaan feature selection dapat meningkatkan akurasi pada klasifikasi data teks. Sedangkan penggunaan bobot TFIDF secara keseluruhan memiliki hasil yang kurang baik jika dibandingkan dengan penggunaan bobot TF.
![]() |
Text
S_KOM_1504286_Title.pdf Download (816kB) |
![]() |
Text
S_KOM_1504286_Chapter1.pdf Download (244kB) |
![]() |
Text
S_KOM_1504286_Chapter2.pdf Restricted to Staf Perpustakaan Download (616kB) |
![]() |
Text
S_KOM_1504286_Chapter3.pdf Download (305kB) |
![]() |
Text
S_KOM_1504286_Chapter4.pdf Restricted to Staf Perpustakaan Download (683kB) |
![]() |
Text
S_KOM_1504286_Chapter5.pdf Download (222kB) |
![]() |
Text
S_KOM_1504286_Appendix.pdf Restricted to Staf Perpustakaan Download (1MB) |
Item Type: | Thesis (S1) |
---|---|
Additional Information: | Link Google Scholar: https://scholar.google.com/citations?user=R20SJKYAAAAJ&hl=en&oi=ao https://scholar.google.com/citations?user=61vphZ0AAAAJ&hl=en&oi=ao ID SINTA Dosen Pembimbing: Yaya Wihardi : 5994413 Rosa Ariani Sukamto : 5974496 |
Uncontrolled Keywords: | Informasi Kehilangan, Feature Selection, Information Gain, Chi-Square, Document Frequency, TFIDF, Naïve Bayes |
Subjects: | L Education > L Education (General) Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer |
Depositing User: | Burhanudin |
Date Deposited: | 14 Sep 2022 02:37 |
Last Modified: | 14 Sep 2022 02:37 |
URI: | http://repository.upi.edu/id/eprint/80363 |
Actions (login required)
![]() |
View Item |