DIGITAL LIBRARY



JUDUL:IMPACT OF A SYNTHETIC DATA VAULT FOR IMBALANCED CLASS IN CROSS-PROJECT DEFECT PREDICTION
PENGARANG:PUTRI NABELLA
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2024-06-01


Software Defect Prediction (SDP) sangat penting untuk memastikan kualitas perangkat lunak. Namun, ketidakseimbangan kelas (CI) menimbulkan tantangan yang signifikan dalam pemodelan prediktif. Penelitian ini memperkenalkan pendekatan baru dengan menggunakan Synthetic Data Vault (SDV) untuk menangani CI dalam Cross-Project Defect Prediction (CPDP). Secara metodologis, penelitian ini membahas CI di beberapa set data (ReLink, MDP, dan PROMISE) dengan memanfaatkan SDV untuk menambah kelas minoritas. Klasifikasi menggunakan Decision Tree (DT), Logistic Regression (LR), K-Nearest Neighbors (KNN), Naive Bayes (NB), dan Random Forest (RF), serta kinerja model dievaluasi menggunakan AUC dan t-Test. Hasilnya secara konsisten menunjukkan bahwa SDV memiliki kinerja yang lebih baik daripada SMOTE dan teknik lainnya dalam berbagai proyek. Keunggulan ini terbukti melalui peningkatan yang signifikan secara statistik. Dominasi KNN pada hasil rata-rata AUC, dengan nilai 0.695, 0.704, dan 0.750. Pada ReLink, KNN menunjukkan peningkatan 16,06% dibandingkan imbalanced dan 12,84% dibandingkan SMOTE. Demikian pula, pada MDP, KNN menunjukkan peningkatan 20,71% dibandingkan dengan imbalanced dan 10,16% dibandingkan dengan SMOTE. Selain itu, pada PROMISE, KNN 13,55% lebih baik dari imbalanced dan 7,01% dari SMOTE. RF menunjukkan kinerja yang moderat, diikuti oleh LR dan DT, sementara NB tertinggal di belakang. Secara keseluruhan, SDV mendapatkan peningkatan 10,10% dari imbalanced, dan 7,54% dari SMOTE. Signifikansi statistik dari temuan ini dikonfirmasi oleh t-Test, semuanya di bawah ambang batas 0,05. Implikasi praktis dari penerapan SDV untuk deteksi cacat dan mitigasi CI terletak pada efektivitasnya yang telah terbukti, terutama dengan KNN sebagai algoritma klasifikasi terbaik, yang menunjukkan potensi yang menjanjikan untuk meningkatkan kualitas perangkat lunak dengan mengatasi CI dan meningkatkan hasil pemodelan prediktif.

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI