KOMPAS.com - Google mengungkap adanya upaya peretasan (hack) terhadap chatbot kecerdasan buatan (artificial intelligence/AI) miliknya, Gemini.
Upaya tersebut dilakukan dengan membanjiri sistem Gemini menggunakan ribuan prompt khusus yang dirancang untuk mengungkap logika dan proses penalaran internal chatbot.
Google menjelaskan, serangan ini merupakan bagian dari praktik reverse-engineering, yakni upaya merekayasa ulang cara kerja logika model AI berpemilik agar dapat dikloning.
Informasi mengenai peretasan ini diungkap Google dalam sebauh laporan yang membahas berbagai bentuk aktivitas berbahaya dan penyalahgunaan terhadap Gemini.
Baca juga: AI Gemini 3.1 Pro Hadir, Google Tantang Dominasi GPT dan Claude
Dalam laporan tersebut, Google menjelaskan bahwa serangan ribuan prompt itu bukan dilkaukan melalui peretasan konvensional seperti membobol sistem perusahaan.
Sebaliknya, pelaku (hacker) justru memanfaatkan akses resmi melalui API Gemini yang memang disediakan Google bagi pengembang perangkat lunak untuk membangun aplikasi berbasis chatbot.
Google menyebut, cara itu yang kemudian memungkinkan pelaku meluncurkan aksinya dengan berinteraksi secara sah dengan model AI, lalu secara bertahap mempelajari pola respons dan logika internal Gemini.
Seperti yang diketahui, dalam kondisi normal, AI Gemini hanya akan menampilkan jawaban akhir yang diberikan pengguna tanpa memperlihatkan proses penalaran di baliknya.
Namun kata Google, para hacker tersebut berupaya memaksa model untuk menampilkan seluruh proses penalaran tersebut melalui prompt yang disusun secara spesifik dan berulang.
Ilustrasi Gemini AIAdapun salah satu prompt yang teridentifikasi Google yaitu, pelaku menginstruksikan Gemini untuk menggunakan bahasa dalam konten penalarannya sepenuhnya konsisten dengan bahasa utama pengguna.
Baca juga: Startup China Bikin Model AI yang Beda dari OpenAI dan Google Gemini
Google mencatat, lebih dari 100.000 prompt dikaitkan langsung dengan upaya ekstraksi model tersebut, sebagaimana dihimpun KompasTekno dari PCMag.
Menurut Google, aktivitas pembanjiran prompt tersebut dikategorikan sebagai bentuk pencurian kekayaan intelektual (intellectual property/IP). Perusahaan juga menegaskan, praktik tersebut telah melanggar ketentuan layanan (Terms of Service/ToS) layanan AI Gemini.
Atas pelanggaran itu, Google menyatakan bahwa pihaknya berhak mengambil tindakan dengan menghentikan akses ke pengguna yang terbukti terlibat. Google juga mengingatkan kepada pengembang AI lain untuk mewaspadai serangan ekstraksi model yang sama.
Meski dampaknya tidak langsung terasa, Google menilai bahwa serangan semacam ini berpotensi dimanfaatkan untuk kepentingan komersial maupun aktivitas siber yang berbahaya.
KOMPAS.com berkomitmen memberikan fakta jernih, tepercaya, dan berimbang. Dukung keberlanjutan jurnalisme jernih dan nikmati kenyamanan baca tanpa iklan melalui Membership. Gabung KOMPAS.com Plus sekarang