sun
moon
Premium Partner :
  • partner tek.id poco
  • partner tek.id acer
  • partner tek.id samsung
  • partner tek.id realme
  • partner tek.id telkomsel
Selasa, 23 Mei 2023 13:03 WIB

Meta kenalkan model AI yang bisa kenali hingga 4.000 bahasa

Proyek yang dinamai Massively Multilingual Speech (MMS) saat ini tersedia sebagai open-source untuk membantu melestarikan keragaman bahasa dan mendorong para peneliti dalam membangun fondasinya. 

Meta kenalkan model AI yang bisa kenali hingga 4.000 bahasa

Model bahasa AI buatan Meta, bukan dari ChatGPT, memiliki kemampuan mengenali lebih dari 4.000 bahasa lisan dan menghasilkan ucapan (text-to-speech) di lebih dari 1.100. 

Proyek yang dinamai Massively Multilingual Speech (MMS) saat ini tersedia sebagai open-source untuk membantu melestarikan keragaman bahasa dan mendorong para peneliti dalam membangun fondasinya. 

“Hari ini, kami membagikan model dan kode kami secara publik sehingga orang lain dalam komunitas riset dapat mengembangkan pekerjaan kami,” tulis perusahaan, dikutip dari Engadget (23/5). “Melalui karya ini, kami berharap dapat memberikan kontribusi kecil untuk melestarikan keanekaragaman bahasa yang luar biasa di dunia.” 

Pengenalan ucapan dan model teks-to-speech biasanya memerlukan pelatihan selama ribuan jam audio yang disertai dengan label transkripsi. Label imi sangat penting untuk pembelajaran mesin, memungkinkan algoritme mengkategorikan dan "memahami" data dengan benar. 

Namun Meta mengungkapkan, ada beberapa bahasa yang tidak banyak di negara industri dan di antaranya terancam punah dalam beberapa dekade mendatang. 

Meta menggunakan pendekatan yang tidak konvensional untuk mengumpulkan data audio dengan memanfaatkan rekaman audio dari teks-teks agama yang diterjemahkan. 

“Kami beralih ke teks-teks agama, seperti Alkitab, yang telah diterjemahkan dalam berbagai bahasa dan terjemahannya telah dipelajari secara luas untuk penelitian terjemahan bahasa berbasis teks,” kata perusahaan. 

Menurut Meta, dengan menggabungkan rekaman Alkitab yang tidak berlabel dan teks serupa, peneliti dapat meningkatkan bahasa model yang tersedia menjadi lebih dari 4.000 bahasa. 

Meski berasal dari isi rekaman religius, Meta meyakinkan bahwa model ini tidak bias menghasilkan bahasa yang lebih religius. Sebab, perusahaan menggunakan pendekatan klasifikasi temporal koneksionis (CTC), yang jauh lebih terbatas dibandingkan dengan model bahasa besar (LLM) atau model urutan-ke-urutan untuk pengenalan suara. 

Selain itu, meskipun sebagian besar rekaman religius dibacakan oleh penutur laki-laki, hal itu juga tidak menimbulkan bias laki-laki — tampil sama baiknya dalam suara perempuan dan laki-laki. 

Setelah melatih model penyelarasan untuk membuat data lebih bermanfaat, Meta menggunakan wav2vec 2.0, model "pembelajaran representasi ucapan mandiri", yang dapat melatih data tanpa label.  

Secara khusus, Meta membandingkan MMS dengan Whisper OpenAI , dan itu melebihi ekspektasi. “Kami menemukan bahwa model yang dilatih pada data Massively Multilingual Speech mencapai separuh tingkat kesalahan kata, tetapi Massively Multilingual Speech mencakup 11 kali lebih banyak bahasa.” 

Meta memperingatkan model bahasa AI-nya tidak sempurna. Ada beberapa risiko MMS dapat salah menerjemahkan kata atau frasa tertentu sehimgga dapat mengakibatkan bahasa yang menyinggung dan/atau tidak akurat. 

"Kami terus percaya bahwa kolaborasi lintas komunitas AI sangat penting untuk pengembangan teknologi AI yang bertanggung jawab.”

Share
×
tekid
back to top