DIGITAL LIBRARY
| JUDUL | : | KLASIFIKASI KONTEN EKSPLISIT PADA LIRIK LAGU BAHASA INDONESIA DAN BAHASA INGGRIS MENGGUNAKAN METODE MBERT | |
| PENGARANG | : | Faridah | |
| PENERBIT | : | UNIVERSITAS LAMBUNG MANGKURAT | |
| TANGGAL | : | 2025-07-17 |
Penelitian ini bertujuan untuk mengembangkan sistem klasifikasi otomatis guna mendeteksi konten eksplisit pada lirik lagu berbahasa Indonesia dan Inggris. Lirik lagu sering kali memuat unsur eksplisit baik secara langsung maupun tersirat, namun klasifikasi otomatis terhadap jenis konten ini masih terbatas, khususnya untuk kasus yang melibatkan lebih dari satu bahasa. Penelitian sebelumnya umumnya hanya berfokus pada satu bahasa sehingga kurang relevan dalam konteks globalisasi konten digital. Dalam penelitian ini, penulis menggunakan model Multilingual BERT (mBERT) yang dirancang untuk memahami berbagai bahasa dalam satu arsitektur. Dataset yang digunakan terdiri dari 33.420 lirik lagu yang dikumpulkan dari penelitian terdahulu dan repositori publik di Kaggle. Tahapan preprocessing mencakup case folding, text cleaning, undersampling (untuk kondisi data seimbang), label encoding, dan tokenisasi. Data dibagi dengan rasio 80:20 dan 70:30, menggunakan dan tanpa stratified sampling. Model kemudian dievaluasi melalui delapan variasi pengujian berdasarkan kombinasi rasio pembagian, keseimbangan distribusi label, dan penggunaan stratifikasi. Model dilatih dengan pendekatan transfer learning berbasis mBERT dan dioptimalkan melalui grid-search untuk menentukan parameter terbaik, yaitu batch size 32, epoch 7–10, dan dropout rate 0,2–0,3. Hasil pengujian menunjukkan bahwa kondisi data seimbang dengan rasio 80:20 menghasilkan performa terbaik dengan f1-score sebesar 83,99%, sedangkan pada data tidak seimbang mencapai 66,53%. Analisis lebih lanjut menunjukkan bahwa meskipun model cukup efektif dalam mengenali konten eksplisit secara tekstual, kemampuannya masih terbatas dalam mendeteksi konten eksplisit yang bersifat implisit. Temuan ini menunjukkan perlunya pengayaan konteks semantik dalam pengembangan model lanjutan yang lebih adaptif terhadap nuansa bahasa.
| NO | DOWNLOAD LINK |
| 1 | FILE 1 |
File secara keseluruhan dapat di unduh DISINI