ANALISIS KETIDAKSEIMBANGAN KELAS MENGGUNAKAN TEKNIK ANSAMBEL PADA PREDIKSI CACAT PERANGKAT LUNAK

Ravena, - (2023) ANALISIS KETIDAKSEIMBANGAN KELAS MENGGUNAKAN TEKNIK ANSAMBEL PADA PREDIKSI CACAT PERANGKAT LUNAK. S1 thesis, Universitas Pendidikan Indonesia.

[img] Text
S_RPL_1909185_Title.pdf

Download (529kB)
[img] Text
S_RPL_1909185_Chapter1.pdf

Download (76kB)
[img] Text
S_RPL_1909185_Chapter2.pdf
Restricted to Staf Perpustakaan

Download (313kB)
[img] Text
S_RPL_1909185_Chapter3.pdf

Download (164kB)
[img] Text
S_RPL_1909185_Chapter4.pdf
Restricted to Staf Perpustakaan

Download (508kB)
[img] Text
S_RPL_1909185_Chapter5.pdf

Download (70kB)
[img] Text
S_RPL_1909185_Appendix.pdf
Restricted to Staf Perpustakaan

Download (3MB)
Official URL: http://repository.upi.edu/

Abstract

Prediksi cacat perangkat lunak membutuhkan dataset yang digunakan untuk mengevalusi model. Namun dataset yang digunakan seringkali terdapat distribusi kelas yang tidak seimbang sehingga diperlukan metode yang dapat menangani ketidakseimbangan kelas tersebut. Penelitian ini bertujuan untuk mengetahui performa dari model prediksi serta mengetahui model prediksi yang lebih efektif dalam menangani ketidakseimbangan kelas. Pada penelitian ini dilakukan pengembangan model berbasis teknik ansambel seperti Random Forest, Extra Trees, Adaboost, dan Gradient Boosting dengan menerapkan metode sampling seperti RUS (Random Under Sampling) dan SMOTE (Syntetic Minority Over- sampling Technique) yang berguna untuk menyeimbangkan kelas yang ada. Selain itu, performa model dapat diketahui dengan melakukan evaluasi performa seperti accuracy, balanced accuracy, gmean, dan AUC yang dinilai mampu dalam menangani ketidakseimbangan kelas. Hasil penelitian ditemukan bahwa performa keempat model berada pada rentang 65% hingga 93% dari keempat metrik tersebut dimana nilai terbaik terdapat pada model prediksi extra trees dengan rata-rata nilai hampir 93%, disusul dengan random forest dengan nilai 90 hingga 91%, serta Adaboost dan Gradient Boosting yang mendapat nilai dalam rentang 84 hingga 89%. Adapun berdasarkan hasil performa model prediksi tersebut, model prediksi yang lebih efektif dalam menangani ketidakseimbangan kelas terdapat pada metode bagging yaitu Extra Trees yang ditunjukkan dari tingginya performa pada 9 dari 10 dataset yang ada dibandingkan dengan model prediksi lain disusul dengan Random Forest. Walaupun metode boosting memiliki performa yang tidak setinggi metode bagging, tapi performa yang diperoleh lebih baik dibandingkan penelitian sebelumnya. --------- Software defect prediction requires a dataset used to evaluate the model. However, the dataset used is often an unbalanced class distribution, so there is a need for a method that can handle such class imbalances. This study aims to find out the performance of predictive models as well as to find more effective predictive models in handling class imbalances. In this study, the development of ensemble technique-based models such as Random Forest, Extra Trees, Adaboost, and Gradient Boosting by applying sampling methods such as RUS (Random Under Sampling) and SMOTE (Synthetic Minority Over-sampling Technique) which are useful for balancing existing classes. In addition, model performance can be identified by performance evaluations such as accuracy, balanced accuracy, gmean, and auc that are considered capable of handling class imbalances. The results of the study were found that the performance of the four models was in the range of 65% to 93% of the four metrics, where the best value was in the extra trees prediction model with an average value of almost 93%, followed by random forests with a value of 90 to 91%, There are Adaboost and Gradient Boosting that are rated in the range of 84 to 89%. Based on the performance results of the prediction model, a more effective prediction model in handling class imbalances is found in the bagging method, which is the Extra Trees shown from the high performance in 9 out of 10 existing datasets compared to other prediction models followed by Random Forest. Although the boost method has a performance that is not as high as the bagging method, the performance obtained is better than previous studies.

Item Type: Thesis (S1)
Additional Information: Link Google Scholar: https://scholar.google.com/citations?user=0n6xmoYAAAAJ&hl ID SINTA Dosen Pembimbing: Dian Anggraini: 6681986 Mochamad Iqbal Ardimansyah : 6658552
Uncontrolled Keywords: Prediksi Kecacatan Perangkat Lunak, Ketidakseimbangan Kelas, Teknik Ansambel, Metode Sampling, Software Defect Prediction, Class Imbalance, Ensemble Technique, Sampling Method
Subjects: L Education > L Education (General)
Q Science > QA Mathematics > QA76 Computer software
T Technology > T Technology (General)
Divisions: UPI Kampus cibiru > S1 Rekayasa Perangkaat Lunak
Depositing User: Ravena
Date Deposited: 04 Sep 2023 07:30
Last Modified: 04 Sep 2023 07:30
URI: http://repository.upi.edu/id/eprint/100419

Actions (login required)

View Item View Item