DIGITAL LIBRARY



JUDUL:Analisis Kinerja Algoritma Klasifikasi Berbasis Pohon Menggunakan SMOTE Terhadap Data Tidak Seimbang
PENGARANG:Sigit Wibowo
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2023-08-28


Data tidak seimbang menjadi permasalahan tersendiri dalam proses penambangan data. Data tidak seimbang disebabkan distribusi kelas pada dataset tidak merata, sehingga terbentuk kelompok kelas mayoritas dan minoritas, dan berdampak pada hasil klasifikasi.Resampling data menjadi upaya untuk meningkatkan kinerja model klasifikasi. Penerapan SMOTE pada algoritma berbasis pohon seperti Random Forest, CART, danC5.0 dapat memperbaiki kinerja model dalam menghadapi dataset yang tidak seimbang dengan menambahkan sampel sintetis pada kelas minoritas, dan meningkatkan kemampuan klasifikasi pada kelas minoritas. Namun, diantara Random Forest, CART, danC5.0  belum ada dilakukan perbandingan untuk menghadapi kasus data tidak seimbang. Pada penelitian ini melakukan analisis kinerja algoritma Random Forest, CART, danC5.0 menggunakan SMOTE pada dataset Diabetes Disesase, Stroke Prediction, dan Customer Churn. Tujuan penelitian ini adalah mendapatkan pengetahuan baru mengenai model klasifikasi berbasis pohon yang dapat memberikan kinerja lebih baik pada data tidak seimbang berdasarkan perbandingan yang dilakukan. Setiap kinerja model dievaluasi menggunakan recall. Dalam analisis kinerja model, model Random forest dan CART tanpa penerapan SMOTE memiliki kinerja sama – sama baik, dengan recall rata-rata 48%,  namun dalam penerapan SMOTE, Random forest dan C5.0memiliki kinerja sama – sama baik dengan recall rata-rata 81%, CART. Penelitian ini menunjukan, SMOTE dapat meningkatkan nilai recall dari model yang digunakan. Namun pada hasil T-Test, CART, C5.0 dan Random forest tidak ada perbedaan signifikan antara model tanpa penerapan SMOTE dan model dengan penerapan SMOTE.

Kata kunci: C5.0, CART, Klasifikasi, Random Forest, SMOTE 

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI