Heboh! Induk TikTok Sedang Kumpulkan Data Besar-besaran, Ada Apa?

Selasa, 08 Oktober 2024 - 18:08 WIB
loading...
Heboh! Induk TikTok...
Dengan data yang dikumpulkan, ByteDance dapat meningkatkan berbagai produk dan layanannya, termasuk fungsi pencarian di TikTok. Foto: ist
A A A
CHINA - ByteDance, perusahaan induk TikTok yang berbasis di China, tampaknya ingin mengejar ketertinggalan dalam perlombaan Artificial Intelligence (AI) generatif.

Mereka baru saja meluncurkan web crawler atau scraper bot sendiri yang dijuluki Bytespider pada April 2024 silam, menurut riset dari Kasada, perusahaan yang berspesialisasi dalam manajemen bot. Keberadaan bot ini juga dikonfirmasi oleh Dark Visitors, yang memantau aktivitas scraper bot.

Bytespider: Scraper Paling Agresif di Internet

Riset menunjukkan bahwa Bytespider dengan cepat menjadi salah satu scraper paling agresif di internet. Mesin tersebut mengumpulkan data dengan kecepatan yang jauh melampaui perusahaan besar lainnya, seperti Google, Meta, Amazon, OpenAI, dan Anthropic, yang juga menggunakan scraper bot untuk membangun dan meningkatkan model bahasa besar atau model multimodal mereka (LLM/LMM).

"Sejak Bytespider muncul, ia telah mengumpulkan data dengan kecepatan sekitar 25 kali lipat dari GPTbot, yang mengumpulkan data untuk platform ChatGPT OpenAI dan model-model dasarnya,” beber Sam Crowther, CEO Kasada.

Bytespider juga mengumpulkan data dengan kecepatan 3.000 kali lipat dari ClaudeBot (Anthropic), yang mengoperasikan platform Claude.

Aktivitas Scraping Meningkat

Menurut Kasada, Bytespider menjadi semakin agresif dalam mengumpulkan data. Data menunjukkan lonjakan besar dalam aktivitas scraping dari Bytespider selama enam minggu terakhir.

Kontroversi Web Scraping

Web scraping telah ada selama beberapa dekade, terutama dilakukan oleh mesin pencari untuk mengumpulkan tautan ke halaman web. Namun, kebangkitan alat AI generatif telah menambahkan dimensi baru dan menjadikan praktik ini sumber gugatan dan kontroversi.

Individu dan organisasi yang karyanya diambil berpendapat bahwa hak cipta mereka dilanggar dalam proses tersebut.

Semua model yang mendasari alat AI generatif dilatih dengan sejumlah besar data online, yang pada dasarnya adalah semua yang tersedia di web, terutama informasi tertulis. Perusahaan teknologi menggunakan scraper bot untuk menyalin semua itu secara gratis dan memasukkannya ke dalam set data mereka.

ByteDance Mengejar Ketertinggalan

Tahun lalu, ByteDance dilaporkan sangat tertinggal dalam perlombaan AI generatif sehingga mereka menggunakan OpenAI untuk membantu membangun LLM ByteDance sendiri, yang bertentangan dengan ketentuan layanan OpenAI.

Awal tahun ini, ByteDance merilis LLM berbasis chat yang disebut Duabo, tetapi pengembangan model itu telah selesai sebelum akumulasi data pelatihan yang lebih baru yang dikumpulkan oleh Bytespider.

LLM Baru dan Fungsi Pencarian TikTok

Menurut sumber internal perusahaan , ByteDance sedang mengembangkan LLM baru. Salah satu tujuannya adalah untuk meningkatkan fungsi pencarian di TikTok.
Halaman :
Dapatkan berita terkini dan kejutan menarik dari SINDOnews.com, Klik Disini untuk mendaftarkan diri anda sekarang juga!
Lanjut Baca Berita Terkait Lainnya
Berita Terkait
Mau Traveling Keluarga...
Mau Traveling Keluarga Lebih Menyenangkan? Ikuti 5 Tips ala Tika Nurjanah
Google Luncurkan Gemini...
Google Luncurkan Gemini 3.5 Live Translate, Terjemahkan Bahasa secara Real-time
OpenAI dan NVIDIA Mengadopsi...
OpenAI dan NVIDIA Mengadopsi Teknologi Watermark AI Google
Google Merombak Bilah...
Google Merombak Bilah Pencariannya setelah 25 Tahun Diperkenalkan
Gara-gara AI Semakin...
Gara-gara AI Semakin Pintar, Matt Lowrie Tinggalkan Google
Google Luncurkan Fitbit...
Google Luncurkan Fitbit Air, Gelang Pintar Rp1,7 Juta yang Tidak Memiliki Layar
Dulu Dibully Karena...
Dulu Dibully Karena Pendiam, Kini Syawal Adha Raih Centang Biru TikTok dan Instagram
Kisah Mas Rushh Bangun...
Kisah Mas Rushh Bangun Personal Branding lewat Konten Keluarga
Ruben Onsu Soroti Live...
Ruben Onsu Soroti Live TikTok Anak hingga Malam Hari, Hak Asuh Jadi Pertimbangan Serius
Rekomendasi
PN Jakpus Eksekusi Lahan...
PN Jakpus Eksekusi Lahan Hotel Sultan Senilai Rp28,9 Triliun
Tantang Dominasi Dolar...
Tantang Dominasi Dolar AS, China Perluas Penggunaan Yuan secara Global
Rahasia Emblem Emas...
Rahasia Emblem Emas Harry Kane di Jersey Piala Dunia 2026
Berita Terkini
Israel Temukan Batu...
Israel Temukan Batu Suci Berusia 2.700 Tahun yang Tertulis dalam Alkitab
Samsung Berencana Bangun...
Samsung Berencana Bangun Pusat Data Terapung di Laut
Trump T1 Phone Ternyata...
Trump T1 Phone Ternyata HTC U24 Pro Buatan China: Ini Bukti Teardown-nya
Kantongi Laba Rp33,72...
Kantongi Laba Rp33,72 Miliar, Elitery (ELIT) Fokus Kembangkan AI dan Cybersecurity
Perkuat Transformasi...
Perkuat Transformasi dan ESG, TelkomGroup Rilis Laporan Keberlanjutan 2025 untuk Masa Depan Digital
Fasilitasi Pasar Sekunder...
Fasilitasi Pasar Sekunder Esports, HIDDEN SUPPLY Kelola Transaksi Aset Tak Berwujud
Infografis
Rusia Serang Ukraina...
Rusia Serang Ukraina Besar-besaran dengan 120 Rudal dan 90 Drone
Copyright ©2026 SINDOnews.com All Rights Reserved