PEMBANGUNAN MODEL KLASIFIKASI BOT SOSIAL TWITTER/X DENGAN SEMI SUPERVISED LEARNING DAN SUPPORT VECTOR MACHINE

Ardian Hafizh Nurhilman, - (2024) PEMBANGUNAN MODEL KLASIFIKASI BOT SOSIAL TWITTER/X DENGAN SEMI SUPERVISED LEARNING DAN SUPPORT VECTOR MACHINE. S1 thesis, Universitas Pendidikan Indonesia.

[img] Text
S_RPL_2007714_Title.pdf

Download (1MB)
[img] Text
S_RPL_2007714_Chapter1.pdf

Download (557kB)
[img] Text
S_RPL_2007714_Chapter2.pdf
Restricted to Staf Perpustakaan

Download (955kB)
[img] Text
S_RPL_2007714_Chapter3.pdf

Download (1MB)
[img] Text
S_RPL_2007714_Chapter4.pdf
Restricted to Staf Perpustakaan

Download (1MB)
[img] Text
S_RPL_2007714_Chapter5.pdf

Download (543kB)
[img] Text
S_RPL_2007714_Appendix.pdf
Restricted to Staf Perpustakaan

Download (5MB)
Official URL: https://repository.upi.edu/

Abstract

Twitter (atau yang sekarang diberi nama “X”) merupakan salah satu jaringan sosial yang paling populer di dunia dan dengan jangkauan yang global. Dengan kepopuleran tersebut salah satu industri yang mencoba untuk memanfaatkan jangkauan global tersebut adalah industri e-commerce. Dengan sosial media, sebuah perusahaan e-commerce dapat memberikan marketing dan nilai interaksi kepada konsumennya. Namun, pada media sosial seperti Twitter sebuah bot sosial dapat menggangu proses tersebut. Dengan otomasi, sebuah bot sosial dapat menggangu upaya marketing sebuah perusahaan e-commerce di media sosial. Sebuah bot sosial dapat menyebabkan distorsi statistik dan membuat postingan menjadi populer dengan menggunakan otomatisasi. Ditambah lagi, dengan perkembangannya teknologi, sebuah bot sosial lebih sulit dari sebelumnya untuk dibedakan dengan pengguna asli. Berdasarkan masalah tersebut, dibutuhkan cara untuk mengklasifikasikan apakah postingan pada Twitter berasal dari pengguna asli atau sebuah bot sosial. Pada penelitian ini, akan dibangun model klasifikasi bot sosial twitter/x dengan algoritma Support Vector Machine, dan memanfaatkan semi-supervised learning dengan proses pseudo-labelling untuk meningkatkan kinerja model klasifikasi menggunakan dataset tak berlabel yang dikumpulkan dengan data crawling. Setelah model klasifikasi dibangun, dilakukan evaluasi kinerjanya menggunakan confusion matrix dan berbagai skenario pengujian. Dari beberapa pengujian, model klasifikasi yang dilatih dengan dataset pseudo menghasilkan skor akurasi tertinggi 94% dengan penyetelan parameter SVM C = 100.0 dan rasio pembagian data 80:20. -------------- Twitter (or what is now called "X") is one of the most popular social networks in the world and with a global reach. With this popularity, one industry that is trying to take advantage of this global reach is the e-commerce industry. With social media, an e-commerce company can provide marketing and interaction value to its consumers. However, on social media such as Twitter a social bot can interfere with this process. With automation, a social bot can disrupt an e-commerce company's marketing efforts on social media. A social bot can cause statistical distortion and make posts popular by using automation. Plus, as technology advances, a social bot is harder than ever to distinguish from a real user. Based on this problem, a way is needed to classify whether posts on Twitter come from real users or social bots. In this research, a Twitter/x social bot classification model will be built using the Support Vector Machine algorithm, and utilizing semi-supervised learning with a pseudo-labelling process to improve the performance of the classification model using unlabeled datasets collected by data crawling. After the classification model is built, its performance is evaluated using a confusion matrix and various test scenarios. From several tests, the classification model trained with the pseudo dataset produced the highest accuracy score of 94% with SVM parameter tuning C = 100.0 and a data split ratio of 80:20.

Item Type: Thesis (S1)
Additional Information: https://scholar.google.com/citations?user=k_mtU3MAAAAJ&hl=en ID SINTA Dosen Pembimbing: Mochamad Iqbal Ardimansyah: 6658552 Raditya Muhammad: 6682222
Uncontrolled Keywords: Sosial Media, SVM, Semi-Supervised, Klasifikasi, Twitter Bot
Subjects: L Education > L Education (General)
Q Science > QA Mathematics > QA76 Computer software
T Technology > T Technology (General)
Divisions: UPI Kampus cibiru > S1 Rekayasa Perangkaat Lunak
Depositing User: Ardian Hafizh Nurhilman
Date Deposited: 11 Sep 2024 02:24
Last Modified: 11 Sep 2024 02:24
URI: http://repository.upi.edu/id/eprint/121795

Actions (login required)

View Item View Item