Duh, Meta ketahuan pakai data ilegal untuk latih AI mereka
Dalam sebuah tuntutan terbaru, diketahui bahwa Meta menggunakan data ilegal yang diunduh menggunakan torrent untuk melatih AI mereka, yakni Llama. Bahkan, mereka menghapus metadata dari website yang mereka gunakan untuk menghilangkan kecurigaan.

Meta belakangan ini kembali diterpa beberapa kabar yang kurang enak untuk didengar. Soalnya, dalam beberapa laporan, Meta dilaporkan secara sadar telah menggunakan materi bajakan untuk melatih model AI Llama mereka.
Kabar ini datang dari sebuah gugatan hak cipta yang sedang berlangsung terhadap perusahaan tersebut. Adalah Kadrey, yang dilansir dari laman TechCrunch (13/1) yang mengajukan dokumen pengadilan dimana membahas tentang penggunaan dataset LibGen oleh perusahaan tersebut untuk pelatihan AI.
LibGen secara umum digambarkan sebagai "perpustakaan bayangan" yang menyediakan akses berbagi berkas ke buku, jurnal, gambar, dan materi akademis dan umum lainnya. Namun platform ini disebut bukan sebagai “platform legal”.
Penasihat hukum penggugat, yang meliputi penulis Sarah Silverman dan Ta-Nehisi Coates, menuduh Zuckerberg menyetujui penggunaan LibGen untuk pelatihan meskipun ada kekhawatiran yang dikemukakan oleh para eksekutif dan karyawan perusahaan yang menggambarkannya sebagai "kumpulan data [yang] mereka ketahui telah dibajak".
Perusahaan tersebut menghapus informasi hak cipta dari materi LibGen, menurut pengaduan tersebut, sebelum memberikannya kepada Llama. Meta tampaknya mengakui dalam sebuah dokumen yang diserahkan ke pengadilan bahwa mereka "menghapus semua paragraf hak cipta dari awal dan akhir" dari artikel jurnal ilmiah.
Salah satu teknisi mereka bahkan dilaporkan membuat skrip untuk menghapus informasi hak cipta secara otomatis. Penasihat hukum berpendapat bahwa Meta melakukannya untuk menyembunyikan aktivitas pelanggaran hak cipta mereka dari publik.
Di sisi lain, penasihat hukum dari pelapor menyebutkan bahwa Meta mengakui telah mengunduh materi LibGen melalui torrent, meskipun teknisi mereka merasa tidak nyaman untuk membagikannya "dari laptop perusahaan [milik Meta]."
Silverman, bersama penulis lain, menggugat Meta dan OpenAI atas pelanggaran hak cipta pada tahun 2023. Mereka menuduh perusahaan tersebut menggunakan materi bajakan dari perpustakaan bayangan untuk melatih model AI mereka.
Pengadilan sebelumnya menolak sebagian tuntutan mereka, tetapi penggugat mengatakan pengaduan mereka yang diubah mendukung tuduhan mereka dan menjawab alasan penolakan pengadilan sebelumnya.