DIGITAL LIBRARY
| JUDUL | : | Komparasi Teknik Imputasi untuk Nilai Nol dan Paradigma Seleksi Fitur (GA dan RFE-SHAP) untuk Klasifikasi Penyakit Diabetes Menggunakan Random Forest | |
| PENGARANG | : | MUHAMMAD HENRY ADITYA | |
| PENERBIT | : | UNIVERSITAS LAMBUNG MANGKURAT | |
| TANGGAL | : | 2026-03-03 |
Diabetes salah satu penyakit kronis yang menjadi tantangan kesehatan global dan memerlukan deteksi dini yang akurat serta andal. Pemanfaatan machine learning, khususnya menggunakan dataset Pima Indians Diabetes, telah banyak dilakukan untuk mendukung klasifikasi penyakit ini. Namun, dataset tersebut memiliki permasalahan kualitas data berupa nilai nol yang tidak valid secara medis. Selain itu, perbedaan teknik imputasi dan paradigma seleksi fitur berpotensi menghasilkan variasi performa sekaligus memengaruhi keterbacaan model. Penelitian ini bertujuan mengevaluasi secara komparatif pengaruh kombinasi teknik imputasi (mean, KNN, dan MICE) dan seleksi fitur dengan paradigma berbeda, yaitu Genetic Algorithm (GA) dan RFE-SHAP, terhadap performa dan keterbacaan model Random Forest. Hasil penelitian menunjukkan bahwa kombinasi MICE–GA menghasilkan performa paling tinggi dan efisien pada akurasi (0,7727), precision (0,6610), dan F1-score (0,6903), mean–RFE-SHAP unggul pada recall (0,7407) dengan jumlah fitur lebih sedikit, sedangkan mean–GA memperoleh AUC tertinggi (0,8406), di mana seluruh kombinasi mampu menghasilkan AUC > 0,8 dan RFE-SHAP mengidentifikasi Glucose sebagai fitur paling dominan diikuti BMI, Age, dan Insulin berdasarkan nilai kepentingan fitur (SHAP importance) berada pada rentang 0,0740 hingga 0,1733 serta arah kontribusi (directional contribution) pada rentang –0,0028 hingga +0,0031.
Kata Kunci: Diabetes, Imputasi Data, Seleksi Fitur, Random Forest, RFE-SHAP
| NO | DOWNLOAD LINK |
| 1 | FILE 1 |
File secara keseluruhan dapat di unduh DISINI