DIGITAL LIBRARY



JUDUL:ANALISA ALGORITMA COMPLETE LINKAGE UNTUK PENENTUAN KOPTIMAL PADA KLASTER
PENGARANG:MUHAMMAD RIDHO MUZADA ELFA
PENERBIT:FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
TANGGAL:2018-07-31


ANALISA ALGORITMA COMPLETE LINKAGE UNTUK PENENTUAN KOPTIMAL
PADA KLASTER
(Oleh : Muhammad Ridho Muzada Elfa; Pembimbing : H.Irwan Budiman, S.T,
M.Kom dan Dodon Turianto Nugrahadi, S.Kom., M.Eng ; 2018; 130 Halaman)
Data mining merupakan serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.
Data mining digunakan dalam berbagai kasus, salah satunya yaitu clustering atau
pengelompokkan. Pada penelitian ini penggunaan salah satu metode hierarchical
clustering, yaitu menggunakan algoritma complete linkage guna mengetahui
jumlah k-optimal pada klaster memetakan potensi tanaman pangan di kabupaten
Hulu Sungai Tengah guna mengetahui daerah-daerah (Kecamatan) yang potensial
atau cocok untuk menghasilkan tanaman pangan. Metode complete linkage cocok
digunakan untuk menentukan jumlah klaster optimal, dikarenakan metode inin
menggabungkan data berdasarkan jumlah kedekatan antar data, lalu kemudian
dijadikan satu klaster. Data Penelitian yang digunakan berjumlah 4 data, yaitu 2
data terklasifikasi (Iris Data dan Zoo Data) dan 2 data tidak terklasifikasi (Angka
Partisipasi Sekolah dan Penyakit Kronis 30 Persen Masyarakat Miskin di
Indonesia). Mengapa digunakan 2 jenis data, dikarenakan untuk data terklasifikasi
akan dibandingkan hasil jumlah klaster optimal dengan klasifikasi awal data. Hasil
Perhitungan dari metode tersebut, kemudian divalidasi menggunakan RMSSTD
(Root Mean Square Standard Deviation) untuk mengetahui homogenitas
(persamaan) dalam klaster dan RS (R-Squared) untuk mengetahui heterogenitas
(perbedaan) antar klaster, semakin tinggi nilai RMSSTD dan semakin kecil nilai
RS maka jumlah klaster tersebut semakin optimal, nilai perbandingan RMSSTD
dan RS dilihat melalui plot grafik hasil dari perhitungan dan diambil nilai klaster
optimal berdasarkan signifikansi perubahan yang besar dari RMSSTD dan RS,
setelah dilakukan validasi, dihasilkan jumlah klaster optimal untuk Iris Data
sebanyak 3 klaster, yang mana sesuai dengan jumlah klasifikasi awal data, sehingga
dapat diukur ketepatan hasil yaitu 84%, Zoo Data menghasilkan jumlah klaster
v
sebanyak 7 klaster, berbeda dengan klasifikasi awal data sehingga tidak bisa
dibandingkan, untuk data tidak terklasifikasi, angka partisipasi sekolah
menghasilkan jumlah data yaitu sebanyak 4 klaster, dan penyakit kronis 30 persen
masyarakat miskin di Indonesia yaitu sebanyak 2 klaster. Tidak ada pengaruh
banyaknya jenis data penelitian dengan hasil k-optimal.
Kata Kunci : Data Mining, Clustering, Complete Linkage, RMSSTD dan RS.

Berkas PDF
NODOWNLOAD LINK



File secara keseluruhan dapat di unduh DISINI