Heboh! Induk TikTok Sedang Kumpulkan Data Besar-besaran, Ada Apa?
Selasa, 08 Oktober 2024 - 18:08 WIB
Aktivitas Scraping Meningkat
Menurut Kasada, Bytespider menjadi semakin agresif dalam mengumpulkan data. Data menunjukkan lonjakan besar dalam aktivitas scraping dari Bytespider selama enam minggu terakhir.Kontroversi Web Scraping
Web scraping telah ada selama beberapa dekade, terutama dilakukan oleh mesin pencari untuk mengumpulkan tautan ke halaman web. Namun, kebangkitan alat AI generatif telah menambahkan dimensi baru dan menjadikan praktik ini sumber gugatan dan kontroversi.Individu dan organisasi yang karyanya diambil berpendapat bahwa hak cipta mereka dilanggar dalam proses tersebut.
Semua model yang mendasari alat AI generatif dilatih dengan sejumlah besar data online, yang pada dasarnya adalah semua yang tersedia di web, terutama informasi tertulis. Perusahaan teknologi menggunakan scraper bot untuk menyalin semua itu secara gratis dan memasukkannya ke dalam set data mereka.
ByteDance Mengejar Ketertinggalan
Tahun lalu, ByteDance dilaporkan sangat tertinggal dalam perlombaan AI generatif sehingga mereka menggunakan OpenAI untuk membantu membangun LLM ByteDance sendiri, yang bertentangan dengan ketentuan layanan OpenAI.Awal tahun ini, ByteDance merilis LLM berbasis chat yang disebut Duabo, tetapi pengembangan model itu telah selesai sebelum akumulasi data pelatihan yang lebih baru yang dikumpulkan oleh Bytespider.
Lihat Juga :