Duh, Meta ketahuan pakai data ilegal untuk latih AI mereka

Oleh: Nur Chandra Laksana - Senin, 13 Januari 2025 16:57

Dalam sebuah tuntutan terbaru, diketahui bahwa Meta menggunakan data ilegal yang diunduh menggunakan torrent untuk melatih AI mereka, yakni Llama. Bahkan, mereka menghapus metadata dari website yang mereka gunakan untuk menghilangkan kecurigaan.

Meta belakangan ini kembali diterpa beberapa kabar yang kurang enak untuk didengar. Soalnya, dalam beberapa laporan, Meta dilaporkan secara sadar telah menggunakan materi bajakan untuk melatih model AI Llama mereka.

Kabar ini datang dari sebuah gugatan hak cipta yang sedang berlangsung terhadap perusahaan tersebut. Adalah Kadrey, yang dilansir dari laman TechCrunch (13/1) yang mengajukan dokumen pengadilan dimana membahas tentang penggunaan dataset LibGen oleh perusahaan tersebut untuk pelatihan AI.

LibGen secara umum digambarkan sebagai "perpustakaan bayangan" yang menyediakan akses berbagi berkas ke buku, jurnal, gambar, dan materi akademis dan umum lainnya. Namun platform ini disebut bukan sebagai “platform legal”.

Penasihat hukum penggugat, yang meliputi penulis Sarah Silverman dan Ta-Nehisi Coates, menuduh Zuckerberg menyetujui penggunaan LibGen untuk pelatihan meskipun ada kekhawatiran yang dikemukakan oleh para eksekutif dan karyawan perusahaan yang menggambarkannya sebagai "kumpulan data [yang] mereka ketahui telah dibajak".

Perusahaan tersebut menghapus informasi hak cipta dari materi LibGen, menurut pengaduan tersebut, sebelum memberikannya kepada Llama. Meta tampaknya mengakui dalam sebuah dokumen yang diserahkan ke pengadilan bahwa mereka "menghapus semua paragraf hak cipta dari awal dan akhir" dari artikel jurnal ilmiah.