Kontroversi OpenAI: Diduga Gunakan Video YouTube Secara Ilegal untuk Sora AI
loading...
A
A
A
JAKARTA - Sora AI, model AI teks-ke-video, milik OpenAI belakangan memang banyak dibicarakan. Sebab, hasil video AI buatan Sora benar-benar mirip dengan film buatan manusia. Tapi, ternyata diduga OpenAI melatih Sora menggunakan video YouTube.
Sora adalah salah satu inovasi yang dianggap luar biasa. Betapa tidak, pengguna hanya perlu memberikan prompt deskriptif, dan selanjutnya Sora akan mensimulasikan dunia fisik yang sedang bergerak menggunakan berbagai data video yang dipelajarinya.
Misalnya prompt "seorang astronot sedang berada di Mars, dan bertemu dengan alien,”. Maka Sora akan membuat video seperti itu.
Nah, yang jadi pertanyaan, darimana OpenAI melatih generator video Sora? Benarkah ia mengambil data dari YouTube?
"Dari sudut pandang kreator, ketika seseorang mengunggah kerja keras mereka ke platform kami, mereka memiliki harapan tertentu," kata Mohan.
"Salah satu harapan tersebut adalah bahwa persyaratan layanan akan dipatuhi. Persyaratan ini tidak mengizinkan hal-hal seperti transkrip atau potongan video untuk diunduh, dan itu jelas merupakan pelanggaran."
Seniman dan kreator berada di garda depan, mengklaim bahwa karya berhak cipta mereka tidak dapat digunakan tanpa izin mereka. OpenAI sendiri sudah tidak asing dengan tuntutan hukum. Utamanya tentang praktik pengumpulan data produk AI-nya. Mereka pernah digugat atas tuduhan pelanggaran hak cipta oleh komedian dan penulis Sarah Silverman, penulis "Game of Thrones" George R.R. Martin, dan The New York Times.
Musim panas lalu, lebih dari 8.000 penulis menulis surat terbuka kepada para pemimpin AI, termasuk CEO OpenAI Sam Altman, menuntut kompensasi karena perusahaan menggunakan karya mereka untuk melatih produk AI tanpa izin.
Generatif AI, memang butuh basis data yang sangat besar untuk digunakan melatih model AI mereka. Nah, sumber data yang masif itu hanya dimiliki oleh Google ataupun beberapa perusahaansaja.
Sora adalah salah satu inovasi yang dianggap luar biasa. Betapa tidak, pengguna hanya perlu memberikan prompt deskriptif, dan selanjutnya Sora akan mensimulasikan dunia fisik yang sedang bergerak menggunakan berbagai data video yang dipelajarinya.
Misalnya prompt "seorang astronot sedang berada di Mars, dan bertemu dengan alien,”. Maka Sora akan membuat video seperti itu.
Nah, yang jadi pertanyaan, darimana OpenAI melatih generator video Sora? Benarkah ia mengambil data dari YouTube?
OpenAI: Teka-teki penggunaan data YouTube
Saat pertanyaan tersebut ditembakkan ke Chief Technology Officer OpenAI, Mira Murati, jawabannya ternyata “tidak tahu”. Hal tersebut terungkap dalam wawancara dengan The Wall Street Journal bulan lalu. Murati ditanya apakah generator teks-ke-video OpenAI, Sora, dilatih menggunakan konten video dari YouTube. "Saya sebenarnya tidak yakin tentang itu," jawab Murati.CEO YouTube Soroti Pelanggaran Potensial
Sementara itu, CEO YouTube Neal Mohan kepada Bloomberg menyatakan ia juga tidak tahu apakah OpenAI menggunakan konten YouTube untuk melatih generator videonya. Jika Sora memang menggunakan konten YouTube, menurut Mohan jelas akan menjadi pelanggaran ketentuan layanan platform."Dari sudut pandang kreator, ketika seseorang mengunggah kerja keras mereka ke platform kami, mereka memiliki harapan tertentu," kata Mohan.
"Salah satu harapan tersebut adalah bahwa persyaratan layanan akan dipatuhi. Persyaratan ini tidak mengizinkan hal-hal seperti transkrip atau potongan video untuk diunduh, dan itu jelas merupakan pelanggaran."
Google Lebih Hati-hati
Mohan menambahkan bahwa Google (yang memiliki YouTube) menggunakan beberapa video YouTube untuk melatih platform AI-nya sendiri, Gemini, tetapi hanya jika pembuat konten di platform menyetujui hal itu dalam kontrak mereka.Respons YouTube dan OpenAI
Juru bicara YouTube mengonfirmasi bahwa persyaratan perusahaan "melarang pengunduhan konten YouTube yang tidak sah". Sementara itu, OpenAI tidak berespon terhadap permintaan komentar.Industri AI dan Isu Hak Cipta
Debat tentang jenis konten yang digunakan perusahaan teknologi untuk melatih model AI mereka terus memanas seiring dengan pesatnya perkembangan industri AI.Seniman dan kreator berada di garda depan, mengklaim bahwa karya berhak cipta mereka tidak dapat digunakan tanpa izin mereka. OpenAI sendiri sudah tidak asing dengan tuntutan hukum. Utamanya tentang praktik pengumpulan data produk AI-nya. Mereka pernah digugat atas tuduhan pelanggaran hak cipta oleh komedian dan penulis Sarah Silverman, penulis "Game of Thrones" George R.R. Martin, dan The New York Times.
Musim panas lalu, lebih dari 8.000 penulis menulis surat terbuka kepada para pemimpin AI, termasuk CEO OpenAI Sam Altman, menuntut kompensasi karena perusahaan menggunakan karya mereka untuk melatih produk AI tanpa izin.
Generatif AI, memang butuh basis data yang sangat besar untuk digunakan melatih model AI mereka. Nah, sumber data yang masif itu hanya dimiliki oleh Google ataupun beberapa perusahaansaja.
(dan)