DIGITAL LIBRARY
| JUDUL | : | IMPLEMENTASI MACHINE LEARNING UNTUK SENTIMEN ANALISIS PADA X/TWITTER: STUDI KASUS CLASS OF CHAMPIONS DI INDONESIA | |
| PENGARANG | : | RINI HAFIZAH | |
| PENERBIT | : | UNIVERSITAS LAMBUNG MANGKURAT | |
| TANGGAL | : | 2025-05-27 |
Ekspansi platform media sosial, terutama Twitter (sekarang X), telah menjadikannya sumber yang berharga untuk menangkap sentimen publik secara real-time. Penelitian ini menjawab tantangan untuk menganalisis sentimen secara akurat terkait acara Clash of Champions di Indonesia dengan mengeksplorasi berbagai teknik pembelajaran mesin. Tujuan utamanya adalah untuk mengevaluasi kinerja tiga algoritma klasifikasi - Support Vector Machine (SVM), Random Forest, dan Extreme Gradient Boosting (XGBoost) - ketika dipasangkan dengan dua metode representasi teks yang banyak digunakan: Term Frequency-Inverse Document Frequency (TF-IDF) dan Bag of Words (BoW). Kontribusi utama dari penelitian ini termasuk penerapan Teknik Synthetic Minority Oversampling (SMOTE) untuk mengatasi ketidakseimbangan kelas dan penggunaan GridSearchCV untuk pengoptimalan hyperparameter yang sistematis. Sebuah dataset yang terdiri dari 1.000 tweet dikumpulkan melalui web scraping, dianotasi secara manual, dan diproses menggunakan teknik pemrosesan bahasa alami. Data tersebut dibagi menjadi set pelatihan dan pengujian, dengan model yang dievaluasi berdasarkan akurasi, presisi, recall, skor F1, dan metrik AUC. Hasilnya menunjukkan bahwa model Random Forest dengan representasi TF-IDF mencapai akurasi klasifikasi tertinggi sebesar 91%, sedangkan model XGBoost dengan TF-IDF menghasilkan nilai AUC terbaik sebesar 0,91. Secara umum, TF-IDF mengungguli BoW dalam banyak kasus, menunjukkan kemampuannya yang unggul untuk menangkap pola kata yang lebih bermakna. SMOTE secara efektif mengatasi masalah ketidakseimbangan data, dan GridSearchCV berkontribusi pada penyetelan parameter model yang optimal. Kesimpulannya, penelitian ini menyoroti dampak signifikan dari pemilihan teknik ekstraksi fitur dan algoritma klasifikasi yang sesuai terhadap keberhasilan analisis sentimen untuk data media sosial. Penelitian di masa depan harus mempertimbangkan untuk memasukkan model penyematan kontekstual seperti Word2Vec, FastText, atau pendekatan berbasis transformator seperti BERT untuk meningkatkan akurasi analisis sentimen.
| NO | DOWNLOAD LINK |
| 1 | FILE 1 |
File secara keseluruhan dapat di unduh DISINI