×
Kanal
    • partner tek.id realme
    • partner tek.id samsung
    • partner tek.id acer
    • partner tek.id wd
    • partner tek.id wd
    • partner tek.id wd
    • partner tek.id wd

Wikimedia Luncurkan Wikidata Embedding Project, Buka Akses Data Wikipedia untuk AI

Oleh: Tek ID - Rabu, 01 Oktober 2025 18:08

Wikimedia luncurkan Wikidata Embedding Project, database baru yang buka akses pengetahuan Wikipedia untuk AI secara lebih akurat.

Wikimedia Luncurkan Wikidata Embedding Project, Logo WIkipedia. dok. Wikimedia

Wikimedia Deutschland meluncurkan Wikidata Embedding Project, sebuah database baru yang dirancang untuk mempermudah model kecerdasan buatan (AI) mengakses pengetahuan dari Wikipedia dan platform saudara lainnya. 

Proyek ini menggunakan sistem pencarian semantik berbasis vektor, sebuah teknik yang memungkinkan komputer memahami makna dan hubungan antar kata, dari hampir 120 juta entri yang tersimpan di ekosistem Wikimedia.

Kombinasi dengan dukungan Model Context Protocol (MCP) membuat database ini dapat diakses langsung melalui kueri bahasa alami oleh model bahasa besar (LLM). 

Proyek ini dikembangkan Wikimedia Jerman bekerja sama dengan perusahaan pencarian neural Jina.AI serta penyedia data real-time milik IBM, DataStax.

Sebelumnya, Wikidata memang sudah menyediakan data yang bisa dibaca mesin, tetapi hanya dapat diakses dengan pencarian kata kunci atau bahasa kueri khusus SPARQL. 

Dengan sistem baru ini, AI dapat memanfaatkan retrieval-augmented generation (RAG), yakni metode yang memungkinkan model menarik informasi eksternal agar lebih akurat dan tetap terhubung dengan basis pengetahuan yang dikurasi editor Wikipedia.

Sebagai contoh, ketika kata “scientist” dimasukkan, sistem tidak hanya menampilkan daftar ilmuwan nuklir atau peneliti Bell Labs, tetapi juga menyediakan terjemahan kata ke berbagai bahasa, gambar bebas lisensi, hingga konsep terkait seperti “researcher” dan “scholar.”

Database ini kini dapat diakses publik melalui Toolforge, dan Wikimedia juga menjadwalkan webinar untuk pengembang pada 9 Oktober mendatang.

Peluncuran proyek ini hadir di tengah meningkatnya kebutuhan industri AI terhadap sumber data berkualitas tinggi. 

Banyak laboratorium AI kini menghadapi tantangan hukum maupun biaya besar terkait penggunaan data. Salah satunya terlihat pada Agustus lalu, ketika Anthropic sepakat membayar 1,5 miliar dolar AS untuk menyelesaikan gugatan dari para penulis yang karyanya dipakai sebagai data pelatihan.

Dalam keterangan resminya, manajer proyek Wikidata AI, Philippe Saadé, menegaskan pentingnya kemandirian proyek ini dari dominasi perusahaan raksasa teknologi.

“Peluncuran Embedding Project ini menunjukkan bahwa AI yang kuat tidak harus dikendalikan segelintir perusahaan. Ia bisa bersifat terbuka, kolaboratif, dan dibangun untuk melayani semua orang,” ujarnya dikutip dari TechCrunch.

Dengan langkah ini, Wikimedia menegaskan kembali komitmennya untuk menjaga keterbukaan pengetahuan sekaligus menjawab kebutuhan AI modern akan data yang dapat dipercaya.

Tag

Tagar Terkait

×
back to top