DIGITAL LIBRARY
JUDUL | : | PERBANDINGAN SMOTE-VARIANTS UNTUK MENGATASI KETIDAKSEIMBANGAN DATA PADA PREDIKSI CACAT SOFTWARE | |
PENGARANG | : | MUIZA RAHMAN | |
PENERBIT | : | UNIVERSITAS LAMBUNG MANGKURAT | |
TANGGAL | : | 2023-12-13 |
Ketidakseimbangan data merupakan salah satu masalah penelitian prediksi
cacat software. Ketidakseimbangan data dapat membuat model bias kepada kelas
mayoritas, sementara kebanyakan dataset untuk prediksi cacat software, kelas cacat yang ingin diprediksi merupakan kelas minoritas. Metode umum yang digunakan untuk mengatasi ini adalah pendekatan level data seperti SMOTE-Variants ataupun pendekatan level algoritma seperti Bagging. Penelitian ini menggunakan pendekatan level data SMOTE-Variants yaitu SMOTE, Borderline-SMOTE, SMOTE-ENN dan SMOTE-Tomek-Links. Sementara, pendekatan level algoritma yang digunakan adalah Bagging (Decision Tree) atau Bagging dengan base classifier Decision Tree. Hasilnya model dengan SMOTE-Tomek-Links dan Bagging (Decision Tree) mendapatkan skor rata-rata AUC terbaik sebesar 0,8009. Sementara, SMOTE-ENN
dan Bagging (Decision Tree) mendapatkan skor rata-rata recall terbaik sebesar
0,6480.
Berkas PDF
NO | DOWNLOAD LINK |
1 | FILE 1 |
File secara keseluruhan dapat di unduh DISINI