Selasa 23 Apr 2024 09:58 WIB

Lestarikan Bahasa Daerah, Tiga Bahasa Diaplikasikan dengan Teknologi AI

Penggunaan bahasa daerah tak lebih dari 10 persen di dunia maya di kalangan tertentu

Peluncuran dataset tiga bahasa daerah di Gedung Saint and Techno Park ITB, Kota Bandung
Foto: Dok Republika
Peluncuran dataset tiga bahasa daerah di Gedung Saint and Techno Park ITB, Kota Bandung

REPUBLIKA.CO.ID, BANDUNG---Untuk melestarikan bahasa daerah, tiga bahasa daerah, yaitu Bugis, Bali, dan Minangkabau mulai diaplikasikan pada teknologi artificial intelligence (AI). Menurut Co-Founder of Prosa.AI Ayu Purwarianti, pihaknya berharap penggunaan AI ini bisa memperluas penggunaan bahasa daerah bagi para pengguna internet. 

Karena, menurut Ayu, pada riset yang dilakukan tahun 2022, diketahui bahwa penggunaan bahasa daerah terus menurun. Bahkan, pihaknya mencatat penggunaan bahasa daerah tidak lebih dari 10 persen di dunia maya di kalangan tertentu. 

Baca Juga

“Ini yang kami terus dorong agar bahasa daerah bisa digunakan, salah satunya generasi muda,” ujar Ayu pada acara peluncuran dataset tiga bahasa daerah di Gedung Saint and Techno Park ITB, Kota Bandung, Senin (22/4/2024).

Ayu menjelaskan, Indonesia memiliki peringkat pengguna internet terbesar keempat di dunia. Namun, tantangan yang dihadapi dalam pengolahan bahasa, khususnya bahasa daerah masih kurang. Sehingga perlu dilakukan langkah progresif dengan pembangunan data dan pembangunan model serta benchmark untuk 3 bahasa daerah yaitu Bugis, Bali, dan Minangkabau. 

Menurutnya, tiga bahasa daerah penting dipilih untuk pembangunan data awal yaitu Minangkabau, Bali, dan Bugis. Ketiga bahasa ini, dipilih atas dasar popularitas penggunaan serta representasi geografis yang luas di Indonesia. Bahasa Bali mewakili wilayah Bali-Sasak-Sumbawa, sementara Minangkabau melambangkan wilayah Malayo-Chamic di Sumatera, dan Bahasa Bugis mewakili Sulawesi Selatan.

“Kedepan kami berharap akan semakin banyak bahasa daerah yang bisa masuk ke sistem ini,” katanya. 

Dalam rentang waktu 48 pekan, Fair Forward berhasil mencapai target pembangunan data sebesar 10.000.000 kata. Proses ini melibatkan anotator remote dari masyarakat setempat dengan beragam latar belakang dialek dan jenis pekerjaan, memastikan representasi yang seimbang dari gender. 

Menurut Ayu, data yang terkumpul dianalisis dan dipublikasikan pada platform HuggingFace. Sehingga masyarakat umum diharapkan akan mudah mengakses. Termasuk ketika masyarakat memanfaatkan AI dalam memproduksi tulisan. Kegiatan Fair Forward  dilaksanakan oleh GIZ Indonesia atas nama Kementerian Kerjasama Ekonomi dan Pembangunan Jerman (BMZ). Bekerja sama dengan Kementerian PPN/BAPPENAS Republik Indonesia.

Kordinator Ekosistem dan Pemanfaatan TIK, Direktorat Ketenagalistrikan, Telekomunikasi, dan Informatika, Bappenas RI Andianto Haryoko mengatakan, bahasa adalah salah satu aset nasional kekayaan yang harus dilestarikan. Bahasa nantinya pasti akan punya value untuk peningkatan kapasitas SDM, termasuk meningkatkan perekonomian. 

Advertisement
Berita Lainnya
Advertisement
Advertisement
Advertisement