DIGITAL LIBRARY



JUDUL:PENERAPAN RFECV DAN SMOTE-NC DALAM MODEL RANDOM FOREST UNTUK KLASIFIKASI INDIKASI DIABETES
PENGARANG:NOVIA RAMADHANI PUTRI ZASKIA
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2025-04-29


Teknologi untuk mengumpulkan dan menyajikan data berkembang semakin pesat sehingga penyimpanan data semakin efisien. Hal ini membuat data memiliki ukuran dimensi yang lebih besar, salah satunya yaitu data indikasi penyakit diabetes dari survei BRFSS Amerika Serikat. Data berdimensi besar seringkali memiliki sebagian variabel prediktor yang kurang berkontribusi terhadap prediksi variabel target. Selain itu, data berdimensi besar sering mengalami masalah imbalance class atau ketidakseimbangan kelas yang dapat mengganggu proses analisis, terutama analisis klasifikasi. Kedua masalah ini dapat diatasi dengan penerapan seleksi fitur RFECV dan teknik resampling SMOTE-NC. Penelitian ini bertujuan untuk mengimplementasikan RFECV dan SMOTE-NC dalam model random forest dan mengetahui performa kinerja model dalam mengklasifikasikan indikasi diabetes. Pembentukan model diawali dengan membangun model random forest menggunakan data training, kemudian menerapkan model tersebut ke dalam algoritma RFECV untuk mengeliminasi variabel yang kurang berpengaruh. Analisis dilanjutkan dengan me-resampling data training menggunakan SMOTE-NC, kemudian melatih kembali model random forest menggunakan data training baru. Proses dilanjutkan dengan menguji model menggunakan data testing dan mengevaluasinya. Dari hasil evaluasi, diperoleh performa model dengan nilai sensitivitas sebesar 0.64393, spesifisitas sebesar 0.76079, balanced accuracy sebesar 0.70236, dan nilai AUC sebesar 0.77489 dengan tingkat Klasifikasi Cukup.

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI