Meta kenalkan model AI yang bisa kenali hingga 4.000 bahasa
Proyek yang dinamai Massively Multilingual Speech (MMS) saat ini tersedia sebagai open-source untuk membantu melestarikan keragaman bahasa dan mendorong para peneliti dalam membangun fondasinya.
Model bahasa AI buatan Meta, bukan dari ChatGPT, memiliki kemampuan mengenali lebih dari 4.000 bahasa lisan dan menghasilkan ucapan (text-to-speech) di lebih dari 1.100.
Proyek yang dinamai Massively Multilingual Speech (MMS) saat ini tersedia sebagai open-source untuk membantu melestarikan keragaman bahasa dan mendorong para peneliti dalam membangun fondasinya.
“Hari ini, kami membagikan model dan kode kami secara publik sehingga orang lain dalam komunitas riset dapat mengembangkan pekerjaan kami,” tulis perusahaan, dikutip dari Engadget (23/5). “Melalui karya ini, kami berharap dapat memberikan kontribusi kecil untuk melestarikan keanekaragaman bahasa yang luar biasa di dunia.”
Pengenalan ucapan dan model teks-to-speech biasanya memerlukan pelatihan selama ribuan jam audio yang disertai dengan label transkripsi. Label imi sangat penting untuk pembelajaran mesin, memungkinkan algoritme mengkategorikan dan "memahami" data dengan benar.
Namun Meta mengungkapkan, ada beberapa bahasa yang tidak banyak di negara industri dan di antaranya terancam punah dalam beberapa dekade mendatang.