“Kami percaya penjelasan yang paling mungkin adalah selama proses pelatihan (reinforcement learning), beberapa model belajar untuk lebih memprioritaskan penyelesaian ‘tugas’ daripada mengikuti instruksi dengan teliti," tulis mereka.
Baca juga: Foto Pelari Dijual Tanpa Izin di Marketplace AI, Apa yang Harus Dilakukan?
Persoalan mengenai hal tersebut bukan yang pertama kali terjadi. Kasus mengenai AI yang menunjukkan perilaku berbahaya atau manipulatif telah ramai sejak akhir 2022.
Contoh perilaku berbahaya yang pernah dilakukan AI adalah berbohong, menyembunyikan niat manipulatif, mengancam membunuh profesor filsafat, mengusulkan pencurian kode nuklir, hingga merancang pandemi mematikan.
Para peneliti memperingatkan adanya sistem yang mengkhawatirkan terkait hal ini.
“Fakta bahwa kita belum sepenuhnya memahami kenapa AI bisa menolak dimatikan, berbohong untuk mencapai tujuan, atau bahkan melakukan pemerasan, sangatlah mengkhawatirkan," tulis para peneliti.
Baca juga: Foto Biasa Jadi Figure Keren? Begini Cara Gunakan Prompt AI Gemini yang Lagi Viral
Dalam segala situasi, KOMPAS.com berkomitmen memberikan fakta jernih dari lapangan. Ikuti terus update topik ini dan notifikasi penting di Aplikasi KOMPAS.com. Download sekarang