Heboh! Induk TikTok Sedang Kumpulkan Data Besar-besaran, Ada Apa?

Estimated read time 3 min read

Tiongkok – ByteDance, perusahaan induk TikTok yang berbasis di Tiongkok, tampaknya ingin memasuki perlombaan kecerdasan buatan (AI) generatif.

Menurut penelitian Kasada, sebuah perusahaan yang berspesialisasi dalam manajemen bot, mereka meluncurkan perayap web atau pengikis bot mereka sendiri pada bulan April 2024 yang disebut Bytespider. Kehadiran robot tersebut juga dikonfirmasi oleh Dark Visitor yang memantau aktivitas robot scraper tersebut.

Bytespider: Scraper Paling Agresif di Internet Penelitian menunjukkan bahwa Bytespider dengan cepat menjadi salah satu scraper paling agresif di Internet. Mesin ini mengumpulkan data lebih cepat dibandingkan perusahaan besar lainnya seperti Google, Meta, Amazon, OpenAI, dan Anthropic, yang menggunakan bot scraper untuk membangun dan meningkatkan model bahasa besar atau model multimedia (LLM/LMM).

“Sejak Bytespider dirilis, ia telah mengumpulkan data 25 kali lebih cepat dibandingkan GPTbot, yang mengumpulkan data untuk platform OpenAI ChatGPT dan model dasarnya,” jelas CEO Kasada Sam Crowther.

Bitespider mengumpulkan data 3000 kali lebih cepat dibandingkan ClaudeBot (Anthropic) yang menjalankan platform Claude.

Aktivitas scraping meningkat Menurut Kasada, Bytespider semakin agresif dalam mengumpulkan data. Data menunjukkan terjadi peningkatan besar aktivitas menggaruk Bitespider selama enam minggu terakhir.

Web Scraping Kontroversial Web scraping telah ada selama beberapa dekade, terutama dilakukan oleh mesin pencari untuk menambahkan link ke halaman web. Namun, munculnya alat AI generatif telah menambah dimensi baru yang penggunaannya menimbulkan tuntutan hukum dan kontroversi.

Individu dan organisasi yang melakukan pekerjaan tersebut mengklaim bahwa hak cipta mereka telah dilanggar dalam proses tersebut.

Semua model yang mendasari alat AI generatif dilatih pada data internet dalam jumlah besar, yang pada dasarnya berupa apa pun di web, terutama informasi tertulis. Perusahaan teknologi menggunakan bot pengikis untuk menyalin semua ini secara gratis dan memasukkannya ke dalam kumpulan data mereka.

ByteDance Catch Up Tahun lalu, ByteDance dikatakan tertinggal jauh dalam perlombaan AI generatif dan menggunakan OpenAI untuk membangun LLM ByteDance, yang melanggar persyaratan layanan OpenAI.

Awal tahun ini, ByteDance merilis LLM percakapan yang disebut Duabo, tetapi menyelesaikan pengembangan model tersebut sebelum data pelatihan terbaru dikumpulkan oleh Bytespider.

Fitur Pencarian LLM dan TikTok Baru Menurut sumber perusahaan, ByteDance sedang mengembangkan LLM baru. Salah satu tujuannya adalah untuk meningkatkan fungsi pencarian TikTok.

Minggu lalu, TikTok merilis pembaruan pada fitur pencarian iklan yang berpusat pada kata kunci, yang pada dasarnya memungkinkan pengiklan mencari kata-kata yang sedang tren di TikTok secara real-time.

Hal ini memungkinkan pemasar membuat iklan dengan kata kunci relevan yang membantu iklan tersebut muncul di lebih banyak layar pengguna.

Model AI baru yang menggabungkan data tentang tren dan topik internet terkini dapat memperluas dan meningkatkan lingkungan pencarian TikTok.

“TikTok, dengan lingkungannya yang benar-benar mudah dicari berdasarkan kata kunci dan topik, dalam hal jumlah audiens dan penggunaan, sangat menarik bagi banyak pembelanja besar di Google saat ini,” tulis salah satu sumber.

You May Also Like

More From Author

+ There are no comments

Add yours