Heboh! Induk TikTok Sedang Kumpulkan Data Besar-besaran, Ada Apa?

Selasa, 08 Oktober 2024 - 18:08 WIB
loading...
Heboh! Induk TikTok...
Dengan data yang dikumpulkan, ByteDance dapat meningkatkan berbagai produk dan layanannya, termasuk fungsi pencarian di TikTok. Foto: ist
A A A
CHINA - ByteDance, perusahaan induk TikTok yang berbasis di China, tampaknya ingin mengejar ketertinggalan dalam perlombaan Artificial Intelligence (AI) generatif.

Mereka baru saja meluncurkan web crawler atau scraper bot sendiri yang dijuluki Bytespider pada April 2024 silam, menurut riset dari Kasada, perusahaan yang berspesialisasi dalam manajemen bot. Keberadaan bot ini juga dikonfirmasi oleh Dark Visitors, yang memantau aktivitas scraper bot.

Bytespider: Scraper Paling Agresif di Internet

Riset menunjukkan bahwa Bytespider dengan cepat menjadi salah satu scraper paling agresif di internet. Mesin tersebut mengumpulkan data dengan kecepatan yang jauh melampaui perusahaan besar lainnya, seperti Google, Meta, Amazon, OpenAI, dan Anthropic, yang juga menggunakan scraper bot untuk membangun dan meningkatkan model bahasa besar atau model multimodal mereka (LLM/LMM).

"Sejak Bytespider muncul, ia telah mengumpulkan data dengan kecepatan sekitar 25 kali lipat dari GPTbot, yang mengumpulkan data untuk platform ChatGPT OpenAI dan model-model dasarnya,” beber Sam Crowther, CEO Kasada.

Bytespider juga mengumpulkan data dengan kecepatan 3.000 kali lipat dari ClaudeBot (Anthropic), yang mengoperasikan platform Claude.

Aktivitas Scraping Meningkat

Menurut Kasada, Bytespider menjadi semakin agresif dalam mengumpulkan data. Data menunjukkan lonjakan besar dalam aktivitas scraping dari Bytespider selama enam minggu terakhir.

Kontroversi Web Scraping

Web scraping telah ada selama beberapa dekade, terutama dilakukan oleh mesin pencari untuk mengumpulkan tautan ke halaman web. Namun, kebangkitan alat AI generatif telah menambahkan dimensi baru dan menjadikan praktik ini sumber gugatan dan kontroversi.

Individu dan organisasi yang karyanya diambil berpendapat bahwa hak cipta mereka dilanggar dalam proses tersebut.

Semua model yang mendasari alat AI generatif dilatih dengan sejumlah besar data online, yang pada dasarnya adalah semua yang tersedia di web, terutama informasi tertulis. Perusahaan teknologi menggunakan scraper bot untuk menyalin semua itu secara gratis dan memasukkannya ke dalam set data mereka.

ByteDance Mengejar Ketertinggalan

Tahun lalu, ByteDance dilaporkan sangat tertinggal dalam perlombaan AI generatif sehingga mereka menggunakan OpenAI untuk membantu membangun LLM ByteDance sendiri, yang bertentangan dengan ketentuan layanan OpenAI.

Awal tahun ini, ByteDance merilis LLM berbasis chat yang disebut Duabo, tetapi pengembangan model itu telah selesai sebelum akumulasi data pelatihan yang lebih baru yang dikumpulkan oleh Bytespider.

LLM Baru dan Fungsi Pencarian TikTok

Menurut sumber internal perusahaan , ByteDance sedang mengembangkan LLM baru. Salah satu tujuannya adalah untuk meningkatkan fungsi pencarian di TikTok.

Minggu lalu, TikTok merilis pembaruan untuk fungsi pencariannya yang berfokus pada kata kunci untuk iklan, yang pada dasarnya memungkinkan pengiklan untuk mencari kata-kata yang sedang tren di TikTok secara real-time.

Hal ini memungkinkan pemasar untuk membuat iklan dengan kata kunci yang relevan yang seharusnya membantu iklan tersebut muncul di layar lebih banyak pengguna.



Model AI baru dengan data tentang tren dan topik internet terbaru dapat memperluas dan meningkatkan lingkungan pencarian TikTok lebih lanjut.

"Mengingat audiens dan jumlah penggunaan, TikTok dengan lingkungan pencarian yang benar-benar dapat ditawar dengan kata kunci dan topik, itu akan sangat menarik bagi banyak orang yang menghabiskan banyak bujet dengan Google saat ini,” tulisseorangsumber.
(dan)
Dapatkan berita terkini dan kejutan menarik dari SINDOnews.com, Klik Disini untuk mendaftarkan diri anda sekarang juga!
Lanjut Baca Berita Terkait Lainnya
Berita Terkait
Google Maps Kini Bisa...
Google Maps Kini Bisa Kenali Detail Lokasi hanya dari Tangkapan Layar
Shorts YouTube Jadi...
Shorts YouTube Jadi Ancam Popularitas TikTok
Gemini 2.5 Pro Teknologi...
Gemini 2.5 Pro Teknologi AI Terbaik yang Diklaim Bantu Pekerjaan Manusia
Donald Trump Siap Turunkan...
Donald Trump Siap Turunkan Tarif TikTok agar Cepat Terjual
Pemilik TikTok Jadi...
Pemilik TikTok Jadi Orang Terkaya di China
Android Kini Murni Dikembangkan...
Android Kini Murni Dikembangkan oleh Google
Jelang Pelarangan TikTok...
Jelang Pelarangan TikTok di AS, Donald Trump Siapkan Perjanjian Baru
TikTok Akan Hilang di...
TikTok Akan Hilang di AS Jika 4 April 2025 Tidak Dijual
Jadi Andalan Pemudik...
Jadi Andalan Pemudik saat Pulang Kampung, Timeline Google Maps Dihapus
Rekomendasi
Magis Diogo Jota Menangkan...
Magis Diogo Jota Menangkan Liverpool di Derby Merseyside, The Reds Kian Dekat Juara Liga Inggris
Jalur Wisata Pandeglang...
Jalur Wisata Pandeglang Macet Parah, Volume Kendaraan Naik 100%
Porsche Luncurkan Proyek...
Porsche Luncurkan Proyek Percontohan Daur Ulang Baterai Tegangan Tinggi
Berita Terkini
Teknologi Penerjemah...
Teknologi Penerjemah AI DeepSeek Bantu Misi Penyelamatan di Myanmar
27 menit yang lalu
Jamur di kaki Katak...
Jamur di kaki Katak Bikin Ilmuwan Ketakutan, Ini Penyebabnya
3 jam yang lalu
ChatGPT Tambah 1 Juta...
ChatGPT Tambah 1 Juta Pengguna Baru dalam Satu Jam setelah Tren Studio Ghibli
19 jam yang lalu
Spesifikasi dan Harga...
Spesifikasi dan Harga Google Pixel 9a, HP Terjangkau Kaya Fitur AI yang Tidak Masuk Indonesia
23 jam yang lalu
5 Ikan Paling Beracun...
5 Ikan Paling Beracun di Dunia, Sekali Sentuh Nyawa Melayang!
1 hari yang lalu
Dari Tren Ghiblifying...
Dari Tren Ghiblifying hingga Gemini 2.5 Pro, Ini 4 Tren Teknologi Terpopuler di Lebaran 2025
1 hari yang lalu
Infografis
Cegah Perang Besar-besaran...
Cegah Perang Besar-besaran antara Israel dan Hizbullah
Copyright ©2025 SINDOnews.com All Rights Reserved