DIGITAL LIBRARY



JUDUL:PENERAPAN RECURRENT NEURAL NETWORK (RNN) PADA TRANSLITERASI TEKS ARAB KE TEKS LATIN INDONESIA BERBASIS OPTICAL CHARACTER RECOGNITION (OCR)
PENGARANG:NOVIANI
PENERBIT:UNIVERSITAS LAMBUNG MANGKURAT
TANGGAL:2024-01-24


Berdasarkan hasil riset Perguruan Tinggi Ilmu Quran (PTIQ) ada 65 persen dari 229 juta jiwa penduduk Indonesia beragama Islam belum mampu membaca tulisan arab.Transliterasi atau alih aksara dalam Kamus Besar Bahasa Indonesia adalah pengalihan suatu jenis aksara atau huruf ke aksara atau huruf yang lain. Di Indonesia, transliterasi banyak digunakan pada tulisan berbahasa arab yang biasanya ditemukan di buku-buku keagamaan, namun tidak semua tulisan berbahasa arab disertai transliterasi. Penelitian ini berguna untuk permasalahan transliterasi teks arab ke teks latin dengan menggunakan pedoman transliterasi latin Indonesia. Teknologi yang dapat melakukan input secara otomatis tanpa harus diketikkan dengan menggunakan OCR juga diperlukan. Mesin OCR yang dapat digunakan adalah Tesseract OCR karena mendukung berbagai Bahasa terutama Bahasa Arab dan dapat digunakan dengan mudah. Penelitian mengenai mesin penerjemah dengan metode Recurrent Neural Network(RNN) telah banyak dilakukan,yang mana model yang optimal adalah berbasis LSTM untuk proses transliterasi. Penelitian ini dimulai dengan pengolahan dataset teks arab dan teks latin sesuai pedoman di Indonesia dengan dataset 5000 kata yang dibagi menjadi tiga bentuk pembagian training dan testing yaitu 90:10 (4500:500), 80:20 (4000:1000), 70:30 (3500:1500). Dan dihasilkan BLEU Score model yang paling optimal adalah pembagian 90:10 dengan nilai 49.95%. 

 

Kata Kunci: Arab, BLEU Score, Latin, LSTM, RNN, Tesseract OCR, Transliterasi

Berkas PDF
NODOWNLOAD LINK
1FILE 1



File secara keseluruhan dapat di unduh DISINI