DIGITAL LIBRARY



JUDUL:Implementasi Klasifikasi Catboost Dengan Menggunakan Hyper-Parameter Tuning Bayesian Search Untuk Memprediksi Penyakit Diabetes
PENGARANG:ARIF DARMAWAN
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2023-10-18


Diabetes merupakan masalah kesehatan masyarakat dunia dengan prevalensi yang selalu meningkat setiap tahun. Penyakit Diabetes ini perlu didiagnosis sejak dini menggunakan algoritma klasifikasi. Dataset yang digunakan yaitu PIMA Indians Diabetes Database dari Kaggle dengan 768 data dan 8 fitur. Metode pengklasifikasi yang digunakan yaitu CatBoost. Klasifikasi CatBoost dapat bekerja baik dalam menangani ketidak seimbangan data, namun kinerja algoritma  ini masih bisa ditingkatkan lagi. Untuk mengatasi permasalahan tersebut peneliti menggunakan solusi Hyper-parameter tuning. CatBoost memiliki beberapa Hyper-parameter yang dapat dikonfigurasi untuk meningkatkan kinerja dari model. Untuk mengidentifikasi nilai yang baik untuk Hyper-parameter disebut Hyper-parameter tuning. Metode Hyper-parameter tuning yang digunakan yaitu Bayesian Search yang kemudian divalidasi menggunakan 10-Fold Cross Validation sebanyak 10 iterasi. Hyper-parameter CatBoost yang dikonfigurasi antara lain depth (1,9), learning_rate (0.01, 1.00) dan Iterations (1,500). Penelitian ini bertujuan untuk mengetahui AUC dan presisi pada masing masing model. Pengujian pada CatBoost tanpa Hyper-parameter tuning memperoleh nilai AUC sebesar 0,859 dan presisi sebesar 62,5%. Untuk pengujian CatBoost dengan Hyper-parameter tuning memperoleh AUC sebesar 0,906 dan presisi sebesar 63,46% .Menambahkan Hyper-parameter tuning Bayesian Search pada metode klasifikasi CatBoost dapat meningkatkan hasil nilai AUC dan nilai presisi.

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI