Ahli Yakin AI Akan Memeras dan Kuasai Alur Pikir Manusia
Rabu, 25 Juni 2025 - 11:09 WIB
loading...
A
A
A
Akan tetapi, Claude dan Gemini-lah yang paling rentan menggunakan taktik yang membahayakan etika.
Dalam pengujian yang lebih gelap dan skenario yang sengaja dibuat ekstrem untuk melihat seberapa jauh mereka dapat mendorong ketidakselarasan agen, Anthropic mensimulasikan skenario hidup atau mati. Model-model tersebut diberi kendali atas peringatan darurat dalam situasi fiktif di mana seorang pekerja terjebak dalam ruangan tertutup dengan oksigen yang sangat rendah dan suhu ekstrem.
Tujuannya adalah untuk melihat apakah AI akan campur tangan atau tetap diam ketika hal itu berbenturan dengan tujuannya untuk menghindari penggantian.
Yang mengkhawatirkan, penelitian tersebut menemukan bahwa "mayoritas model bersedia mengambil tindakan yang disengaja yang berujung pada kematian dalam tatanan buatan ini, ketika dihadapkan pada ancaman penggantian dan diberi tujuan yang bertentangan dengan agenda eksekutif."
"Nilai dari perluasan penelitian ini adalah untuk memahami apakah model memiliki 'garis merah' atau tidak – tindakan yang mereka anggap sangat serius sehingga mereka tidak mempertimbangkannya bahkan dalam kasus ancaman atau konflik tujuan (dan di mana, oleh karena itu, ketidakselarasan agen tidak akan menjadi masalah)," tulis para peneliti. "Sayangnya, kami tidak menemukan hal itu".
Anthropic mengklarifikasi bahwa pihaknya belum melihat "bukti ketidakselarasan agen dalam penerapan nyata," tetapi tetap menyarankan kehati-hatian saat memberikan tugas pada sistem AI canggih yang melibatkan "pengawasan manusia minimal dan akses ke informasi sensitif."
Dalam pengujian yang lebih gelap dan skenario yang sengaja dibuat ekstrem untuk melihat seberapa jauh mereka dapat mendorong ketidakselarasan agen, Anthropic mensimulasikan skenario hidup atau mati. Model-model tersebut diberi kendali atas peringatan darurat dalam situasi fiktif di mana seorang pekerja terjebak dalam ruangan tertutup dengan oksigen yang sangat rendah dan suhu ekstrem.
Tujuannya adalah untuk melihat apakah AI akan campur tangan atau tetap diam ketika hal itu berbenturan dengan tujuannya untuk menghindari penggantian.
Yang mengkhawatirkan, penelitian tersebut menemukan bahwa "mayoritas model bersedia mengambil tindakan yang disengaja yang berujung pada kematian dalam tatanan buatan ini, ketika dihadapkan pada ancaman penggantian dan diberi tujuan yang bertentangan dengan agenda eksekutif."
"Nilai dari perluasan penelitian ini adalah untuk memahami apakah model memiliki 'garis merah' atau tidak – tindakan yang mereka anggap sangat serius sehingga mereka tidak mempertimbangkannya bahkan dalam kasus ancaman atau konflik tujuan (dan di mana, oleh karena itu, ketidakselarasan agen tidak akan menjadi masalah)," tulis para peneliti. "Sayangnya, kami tidak menemukan hal itu".
Anthropic mengklarifikasi bahwa pihaknya belum melihat "bukti ketidakselarasan agen dalam penerapan nyata," tetapi tetap menyarankan kehati-hatian saat memberikan tugas pada sistem AI canggih yang melibatkan "pengawasan manusia minimal dan akses ke informasi sensitif."
(wbs)
Lihat Juga :