DIGITAL LIBRARY



JUDUL:IMPLEMENTASI METODE LINEAR REGRESSION UNTUK PENANGANAN MISSING VALUES PADA DATASET DIABETES
PENGARANG:IRAWATI HAFID
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2023-01-20


IMPLEMENTASI METODE LINEAR REGRESSION UNTUK PENANGANAN MISSING VALUES PADA DATASET DIABETES

(Oleh : Irawati Hafid; Pembimbing: Irwan Budiman, S.T., M.Kom dan Triando Hamonangan Saragih S.Kom., M.Kom; 60 halaman)

Saat pengambilan data dilapangan sering kali terjadi kesalahan dalam pengambilan data, salah satunya yaitu berupa data kosong atau data tidak lengkap atau disebut juga dengan missing value. Missing value ini mengakibatkan menurunnya kualitas data untuk diproses lebih lanjut oleh algoritma machine learning. Maka diperlukannya sebuah metode untuk mengisi kekosongan data tersebut. Salah satu metode yang bisa mengisi kekosongan tersebut adalah linear regression dimana model akan melakukan pengisian dengan menggunakan persamaan garis lurus yang dibuat dari koefisien-koefisien fitur yang berkaitan dengan target. Pada penelitian ini akan menggunakan linear regression untuk melakukan pengisian data pada dataset Pima Indian Diabetes yang telah diberi missing value sebanyak 10% dengan MCAR. Model linear regression tersebut mendapatkan error RMSE sebesar 48,997 pada imputasi missing value single target, sedangkan pada multi target missing value mendapatkan error RMSE sebesar 30,897 dan RMSE keseluruhan missing value sebesar 40,642.

Kata Kunci : Missing Value, Imputasi Linear Regression, Linear Regression

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI