Rafi Fajrul Ariyadi, - (2025) IMPLEMENTASI VARIATIONAL AUTOENCODER (VAE) UNTUK MENGATASI DATA SPARSITY PADA DATASET SISTEM REKOMENDASI COLLABORATIVE FILTERING. S1 thesis, Universitas Pendidikan Indonesia.
Abstract
Sistem rekomendasi wisata berbasis collaborative filtering (CF) sering kali terkendala oleh masalah fundamental data sparsity, kondisi ini menyebabkan kelangkaan data interaksi menurunkan akurasi model-model klasik seperti Singular Value Decomposition (SVD) dan Alternating Least Squares (ALS). Penelitian ini mengusulkan penggunaan Variational Autoencoder (VAE), sebuah model generatif, sebagai metode augmentasi data yang mampu menghasilkan sinyal preferensi sintetis berkualitas tinggi, serta menunjukkan adanya sinergi yang kuat antara data yang diperkaya VAE dengan algoritma ALS. Metode penelitian yang digunakan adalah Design Research Methodology (DRM), yang mencakup perancangan model VAE untuk mempelajari representasi laten dari data interaksi yang memiliki tingkat sparsity 92.38%. Model VAE kemudian digunakan untuk menghasilkan interaksi pengguna-item sintetis yang berkualitas, sehingga menciptakan matriks interaksi yang lebih padat. Kualitas data hasil augmentasi divalidasi dengan menguji dampaknya terhadap kinerja model SVD dan ALS. Hasil penelitian menunjukkan bahwa augmentasi data berbasis VAE berhasil meningkatkan performa kedua model CF tersebut. Peningkatan paling signifikan dan konsisten terjadi pada model ALS, yang skor NDCG@30-nya meningkat hingga 0.231 pada level augmentasi tertinggi. Kontribusi utama penelitian ini adalah mendemonstrasikan efektivitas VAE sebagai alat augmentasi data yang mampu menghasilkan sinyal preferensi sintetis berkualitas tinggi, serta menunjukkan adanya sinergi yang kuat antara data yang diperkaya VAE dengan algoritma ALS. Kesimpulannya, augmentasi data menggunakan VAE merupakan strategi yang kuat dan efektif untuk meningkatkan akurasi sistem rekomendasi CF yang sudah ada, khususnya dalam menangani dataset dengan tingkat sparsity yang tinggi. -------- Collaborative filtering (CF) based tourism recommender systems are often constrained by the fundamental problem of data sparsity, where the scarcity of interaction data degrades the accuracy of classic models such as Singular Value Decomposition (SVD) and Alternating Least Squares (ALS). This study proposes the use of a Variational Autoencoder (VAE), a generative model, as a data augmentation method capable of generating high-quality synthetic preference signals, and demonstrates the strong synergy between VAE-enriched data and the ALS algorithm.Employing the Design Research Methodology (DRM), a VAE model was designed to learn the latent representations from interaction data with a sparsity level of 92.38%. The VAE was then utilized to generate high-quality synthetic user-item interactions, creating a denser interaction matrix. The quality of the augmented data was validated by testing its impact on the performance of SVD and ALS models. The results show that VAE-based data augmentation successfully improved the performance of both CF models. The most significant and consistent improvement was observed in the ALS model, whose NDCG@30 score increased to 0.231 at the highest augmentation level.The main contribution of this research is demonstrating the effectiveness of VAE as a data augmentation tool capable of producing high-quality synthetic preference signals, as well as revealing a strong synergy between VAE-enriched data and the ALS algorithm. In conclusion, data augmentation using VAE is a robust and effective strategy for enhancing the accuracy of existing CF recommender systems, particularly when dealing with high-sparsity datasets.
![]() |
Text
S_RPL_2101565_Title.pdf Download (684kB) |
![]() |
Text
S_RPL_2101565_Chapter1.pdf Download (271kB) |
![]() |
Text
S_RPL_2101565_Chapter2.pdf Restricted to Staf Perpustakaan Download (764kB) |
![]() |
Text
S_RPL_2101565_Chapter3.pdf Download (580kB) |
![]() |
Text
S_RPL_2101565_Chapter4.pdf Restricted to Staf Perpustakaan Download (712kB) |
![]() |
Text
S_RPL_2101565_Chapter5.pdf Download (222kB) |
![]() |
Text
S_RPL_2101565_Appendix.pdf Restricted to Staf Perpustakaan Download (564kB) |
Item Type: | Thesis (S1) |
---|---|
Additional Information: | https://scholar.google.com/citations?hl=id&user=UGFo9TEAAAAJ&view_op=list_works&gmla=AH8HC4yc9PsBuH9o65Rq6JH-4fOlDXcpg7LIyuVvQ6V6CO71PLGZRwRN3M_LaFCoqxrwiCU0nQ3ALF1SecYjkrB3 ID SINTA Dosen Pembimbing: Mochamad Iqbal Ardimansyah: 6658552 Hendriyana: 6658557 |
Uncontrolled Keywords: | Sistem Rekomendasi, Penyaringan Kolaboratif, Ketersebaran Data, Variational Autoencoder, Pembelajaran Mendalam, Recommendation System, Collaborative Filtering, Data Sparsity, Data Augmentation, Variational Autoencoder, Deep Learning. |
Subjects: | L Education > L Education (General) Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software T Technology > T Technology (General) |
Divisions: | UPI Kampus cibiru > S1 Rekayasa Perangkaat Lunak |
Depositing User: | Rafi Fajrul Ariyadi |
Date Deposited: | 03 Sep 2025 03:24 |
Last Modified: | 03 Sep 2025 03:30 |
URI: | http://repository.upi.edu/id/eprint/137040 |
Actions (login required)
![]() |
View Item |