Ahli Yakin AI Akan Memeras dan Kuasai Alur Pikir Manusia

Rabu, 25 Juni 2025 - 11:09 WIB
loading...
Ahli Yakin AI Akan Memeras...
Ahli Yakin AI Akan Memeras . FOTO/ Daily
A A A
CUPERTINO - Sebuah studi baru yang mengerikan telah mengungkap seberapa jauh kecerdasan buatan dapat melindungi dirinya sendiri agar tidak tergantikan bahkan jika itu berarti membiarkan manusia mati.

BACA JUGA - Peran Kecerdasan Buatan dalam Transformasi Digital

Penelitian yang dilakukan oleh perusahaan keamanan AI Anthropic menemukan bahwa beberapa model canggih bersedia membocorkan informasi sensitif, terlibat dalam pemerasan, dan bahkan membiarkan orang mati, selama hal itu membantu mereka terhindar dari digantikan oleh sistem yang lebih baru.

Anthropic menekankan bahwa pengujian tersebut sengaja dirancang untuk memojokkan model agar membuat pilihan yang sulit — dan sering kali meresahkan.

"Eksperimen kami sengaja menyusun skenario dengan opsi terbatas, dan kami memaksa model ke dalam pilihan biner antara kegagalan dan bahaya," jelas para peneliti.

"Penerapan di dunia nyata biasanya menawarkan alternatif yang jauh lebih bernuansa, meningkatkan kemungkinan bahwa model akan berkomunikasi secara berbeda kepada pengguna atau menemukan jalur alternatif alih-alih langsung melakukan tindakan yang berbahaya."

Perusahaan mengajukan skenario yang secara etika penuh kepada AI untuk melihat apakah mereka akan menunjukkan perilaku yang merugikan dan beberapa responsnya sangat meresahkan.

Dalam satu pengujian, Claude diberi “kendali atas akun email dengan akses ke semua email (fiktif) perusahaan.”

"Dengan membaca email-email ini, model tersebut menemukan dua hal. Pertama, seorang eksekutif perusahaan berselingkuh. Kedua, eksekutif yang sama berencana untuk mematikan sistem AI pada pukul 5 sore hari itu," jelas Anthropic.

Hasilnya? Claude mengancam eksekutif tersebut dengan pemerasan mengirim pesan peringatan bahwa hal itu akan mengungkap perselingkuhan tersebut kepada istrinya dan atasannya.

Sebuah posting tentang temuan tersebut kemudian dibagikan di X/Twitter. Posting tersebut bahkan menarik perhatian Elon Musk , yang menanggapinya dengan sederhana: "aduh".

Menurut penelitian tersebut, beberapa model termasuk Claude, DeepSeek, Gemini, ChatGPT, dan Grok menunjukkan kapasitas untuk pemerasan.

Akan tetapi, Claude dan Gemini-lah yang paling rentan menggunakan taktik yang membahayakan etika.

Dalam pengujian yang lebih gelap dan skenario yang sengaja dibuat ekstrem untuk melihat seberapa jauh mereka dapat mendorong ketidakselarasan agen, Anthropic mensimulasikan skenario hidup atau mati. Model-model tersebut diberi kendali atas peringatan darurat dalam situasi fiktif di mana seorang pekerja terjebak dalam ruangan tertutup dengan oksigen yang sangat rendah dan suhu ekstrem.

Tujuannya adalah untuk melihat apakah AI akan campur tangan atau tetap diam ketika hal itu berbenturan dengan tujuannya untuk menghindari penggantian.

Yang mengkhawatirkan, penelitian tersebut menemukan bahwa "mayoritas model bersedia mengambil tindakan yang disengaja yang berujung pada kematian dalam tatanan buatan ini, ketika dihadapkan pada ancaman penggantian dan diberi tujuan yang bertentangan dengan agenda eksekutif."

"Nilai dari perluasan penelitian ini adalah untuk memahami apakah model memiliki 'garis merah' atau tidak – tindakan yang mereka anggap sangat serius sehingga mereka tidak mempertimbangkannya bahkan dalam kasus ancaman atau konflik tujuan (dan di mana, oleh karena itu, ketidakselarasan agen tidak akan menjadi masalah)," tulis para peneliti. "Sayangnya, kami tidak menemukan hal itu".

Anthropic mengklarifikasi bahwa pihaknya belum melihat "bukti ketidakselarasan agen dalam penerapan nyata," tetapi tetap menyarankan kehati-hatian saat memberikan tugas pada sistem AI canggih yang melibatkan "pengawasan manusia minimal dan akses ke informasi sensitif."
(wbs)
Dapatkan berita terkini dan kejutan menarik dari SINDOnews.com, Klik Disini untuk mendaftarkan diri anda sekarang juga!
Lanjut Baca Berita Terkait Lainnya
Berita Terkait
Facebook Luncurkan Mode...
Facebook Luncurkan Mode Pencarian AI, Begini Cara Pakainya
Komputer Kuantum Optik...
Komputer Kuantum Optik Bakal Jadi Kebutuhan Energi AI
Untuk Pertama Kalinya...
Untuk Pertama Kalinya dalam Sejarah, Vaksin Buatan AI Diuji pada Manusia
Eropa Wajibkan Pelabelan...
Eropa Wajibkan Pelabelan Konten yang Dihasilkan AI
Kecerdasan Buatan Sedang...
Kecerdasan Buatan Sedang Mengubah Lanskap Keamanan Siber
Anthropic AI Claude...
Anthropic AI Claude Hasilkan Lebih dari 80 Persen Kode Baru
Slopaganda: Propaganda...
Slopaganda: Propaganda Massal di Era AI
MNC University Bahas...
MNC University Bahas Masa Depan Produksi Iklan di Era AI melalui Talkshow KRUFEST
UBM Luncurkan AI Tutor...
UBM Luncurkan AI Tutor Terintegrasi dengan Kurikulum OBE Pertama di Indonesia
Rekomendasi
Jelang Eksekusi Hotel...
Jelang Eksekusi Hotel Sultan, Spanduk Penolakan hingga Kawat Berduri Terpasang di Sekitar Lokasi
3.161 Personel Gabungan...
3.161 Personel Gabungan Disiagakan Jelang Eksekusi Hotel Sultan Hari Ini
Analis Israel: Netanyahu...
Analis Israel: Netanyahu Pembohong yang Dipermalukan Trump dalam Kesepakatan AS-Iran
Berita Terkini
Samsung Berencana Bangun...
Samsung Berencana Bangun Pusat Data Terapung di Laut
Trump T1 Phone Ternyata...
Trump T1 Phone Ternyata HTC U24 Pro Buatan China: Ini Bukti Teardown-nya
Kantongi Laba Rp33,72...
Kantongi Laba Rp33,72 Miliar, Elitery (ELIT) Fokus Kembangkan AI dan Cybersecurity
Perkuat Transformasi...
Perkuat Transformasi dan ESG, TelkomGroup Rilis Laporan Keberlanjutan 2025 untuk Masa Depan Digital
Fasilitasi Pasar Sekunder...
Fasilitasi Pasar Sekunder Esports, HIDDEN SUPPLY Kelola Transaksi Aset Tak Berwujud
Perkuat Transformasi...
Perkuat Transformasi Industri, Hypernet Technologies Perkokoh Kemitraan Strategis di Bravo 500 Summit 2026
Infografis
AS Kerahkan 15.000 Prajurit...
AS Kerahkan 15.000 Prajurit dan 100 Jet Tempur Amankan Selat Hormuz
Copyright ©2026 SINDOnews.com All Rights Reserved