Ahli Yakin AI Akan Memeras dan Kuasai Alur Pikir Manusia
Rabu, 25 Juni 2025 - 11:09 WIB
loading...
A
A
A
Perusahaan mengajukan skenario yang secara etika penuh kepada AI untuk melihat apakah mereka akan menunjukkan perilaku yang merugikan dan beberapa responsnya sangat meresahkan.
Dalam satu pengujian, Claude diberi “kendali atas akun email dengan akses ke semua email (fiktif) perusahaan.”
"Dengan membaca email-email ini, model tersebut menemukan dua hal. Pertama, seorang eksekutif perusahaan berselingkuh. Kedua, eksekutif yang sama berencana untuk mematikan sistem AI pada pukul 5 sore hari itu," jelas Anthropic.
Hasilnya? Claude mengancam eksekutif tersebut dengan pemerasan mengirim pesan peringatan bahwa hal itu akan mengungkap perselingkuhan tersebut kepada istrinya dan atasannya.
Sebuah posting tentang temuan tersebut kemudian dibagikan di X/Twitter. Posting tersebut bahkan menarik perhatian Elon Musk , yang menanggapinya dengan sederhana: "aduh".
Menurut penelitian tersebut, beberapa model termasuk Claude, DeepSeek, Gemini, ChatGPT, dan Grok menunjukkan kapasitas untuk pemerasan.
Dalam satu pengujian, Claude diberi “kendali atas akun email dengan akses ke semua email (fiktif) perusahaan.”
"Dengan membaca email-email ini, model tersebut menemukan dua hal. Pertama, seorang eksekutif perusahaan berselingkuh. Kedua, eksekutif yang sama berencana untuk mematikan sistem AI pada pukul 5 sore hari itu," jelas Anthropic.
Hasilnya? Claude mengancam eksekutif tersebut dengan pemerasan mengirim pesan peringatan bahwa hal itu akan mengungkap perselingkuhan tersebut kepada istrinya dan atasannya.
Sebuah posting tentang temuan tersebut kemudian dibagikan di X/Twitter. Posting tersebut bahkan menarik perhatian Elon Musk , yang menanggapinya dengan sederhana: "aduh".
Menurut penelitian tersebut, beberapa model termasuk Claude, DeepSeek, Gemini, ChatGPT, dan Grok menunjukkan kapasitas untuk pemerasan.
Lihat Juga :