DIGITAL LIBRARY



JUDUL:PERBANDINGAN SMOTE-VARIANTS UNTUK MENGATASI KETIDAKSEIMBANGAN DATA PADA PREDIKSI CACAT SOFTWARE
PENGARANG:MUIZA RAHMAN
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2023-12-13


Ketidakseimbangan data merupakan salah satu masalah penelitian prediksi
cacat software. Ketidakseimbangan data dapat membuat model bias kepada kelas
mayoritas, sementara kebanyakan dataset untuk prediksi cacat software, kelas cacat yang ingin diprediksi merupakan kelas minoritas. Metode umum yang digunakan untuk mengatasi ini adalah pendekatan level data seperti SMOTE-Variants ataupun pendekatan level algoritma seperti Bagging. Penelitian ini menggunakan pendekatan level data SMOTE-Variants yaitu SMOTE, Borderline-SMOTE, SMOTE-ENN dan SMOTE-Tomek-Links. Sementara, pendekatan level algoritma yang digunakan adalah Bagging (Decision Tree) atau Bagging dengan base classifier Decision Tree. Hasilnya model dengan SMOTE-Tomek-Links dan Bagging (Decision Tree) mendapatkan skor rata-rata AUC terbaik sebesar 0,8009. Sementara, SMOTE-ENN
dan Bagging (Decision Tree) mendapatkan skor rata-rata recall terbaik sebesar
0,6480.
Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI