DIGITAL LIBRARY



JUDUL:ANALISIS PENGARUH DATA NORMALISASI DAN NON NORMALISASI PADA DETEKSI CYBERBULLYING BERBAHASA INDONESIA DENGAN METODE INDOBERT
PENGARANG:MITA YANI NURMA PRATIWI
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2023-11-16


Kasus cyberbullying yang marak terjadi di media sosial merupakan salah satu dampak negatif dari kebebasan dan kemudahan yang ditawarkan oleh media sosial. Berdasarkan 2.777 hasil polling pada remaja Indonesia berusia 14-24 tahun, 45% dari mereka melaporkan pernah mengalami cyberbullying. Hal ini menunjukkan bahwa deteksi cyberbullying sangat diperlukan sebagai salah satu bentuk pencegahan guna mengurangi kasus cyberbullying. NLP (Natural Language Processing) merupakan salah satu cara yang dapat digunakan untuk membantu dalam mendeteksi cyberbullying. IndoBERT dan IndoBERTweet merupakan pre-trained model yang dapat digunakan untuk deteksi cyberbullying. Data yang digunakan untuk melatih model NLP umumnya melewati tahap normalisasi, yaitu tahap mengubah kalimat non baku ke dalam kalimat baku sesuai dengan kaidah bahasa. Pengguna media sosial di Indonesia sendiri jarang menggunakan bahasa baku dalam melakukan komunikasi. Mereka cenderung menggunakan bahasa non baku dengan berbagai istilah dan kosakata baru. Oleh karena itu, penelitian ini dilakukan untuk mengetahui pengaruh data yang melewati proses normalisasi dan tidak melewati proses normalisasi pada model IndoBERT dan IndoBERTweet dalam mendeteksi cyberbullying. Data yang digunakan berasal dari Twitter dengan jumlah data 13.446. Model IndoBERT dan IndoBERTweet dengan data yang tidak melewati proses normalisasi memiliki hasil performansi lebih baik dibandingkan dengan data yang melewati proses normalisasi. Model IndoBERT tersebut memiliki nilai accuracy, f1-score, recall, dan precision sebesar 0.8520, 0.8520, 0.8520, dan 0.8521. Sementara itu, model IndoBERTweet memiliki memiliki nilai accuracy, f1-score, recall, dan precision sebesar 0.8602, 0.8602, 0.8602, dan 0.8609. Secara keseluruhan, model dengan hasil performansi terbaik adalah model IndoBERTweet dengan data yang tidak dinormalisasi.

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI