DIGITAL LIBRARY



JUDUL:KLASIFIKASI DATA TIDAK SEIMBANG MENGGUNAKAN PENDEKATAN LEVEL DATA DAN SUPPORT VECTOR MACHINE PADA HATE SPEECH TWITTER
PENGARANG:RHEINA MEILIANA FACHMI
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2022-06-09


Masalah ketidakseimbangan data merupakan masalah yang terjadi di mana jumlah kelas data yang satu lebih sedikit atau lebih banyak dibanding dengan jumlah kelas data lainnya. Metode Synthetic Minority Oversampling Technique (SMOTE) dan Random Undersampling (RUS) merupakan metode yang paling banyak diterapkan untuk menangani permasalahan ketidakseimbangan data dan menggunakan Support Vector Machine sebagai metode klasifikasi. Pada penelitian ini pengujian akan dilakukan dengan tanpa dan menyeimbangkan data. Data yang digunakan adalah data hatespeech twitter mengenai pemilihan calon Gubernur 2017. Berdasarka hasil pengujian yang telah dilakukan bahwa pengujian tanpa menyeimbangkan data mendapatkan akurasi sebesar 83,96%, menggunakan SMOTE mendapatkan hasil 85,55%, dan SMOTE+RUS mendapatkan hasil 85,69%. Nilai akurasi tertinggi ada pada pengujian dengan SMOTE+RUS sebesar 85,69%.

Kata kunci: Data tidak seimbang, Synthetic Minority Oversampling Technique, Random Undersampling, Klasifikasi, Support Vector Machine.

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI