Google Bongkar Serangan 100.000 Prompt ke Gemini, Upaya Kloning AI Terkuak

Kompas.com, Diperbarui 02/03/2026, 06:09 WIB

Marsha Bremanda,

Reska K. Nistanto

Tim Redaksi

Lihat Foto

Ilustrasi Gemini. Google menyebut chatbot AI miliknya menjadi sasaran upaya peretasan dengan metode pembanjiran prompt untuk mengkloning cara kerja model AI.()

Sumber PCMag

KOMPAS.com - Google mengungkap adanya upaya peretasan (hack) terhadap chatbot kecerdasan buatan (artificial intelligence/AI) miliknya, Gemini.

Upaya tersebut dilakukan dengan membanjiri sistem Gemini menggunakan ribuan prompt khusus yang dirancang untuk mengungkap logika dan proses penalaran internal chatbot.

Google menjelaskan, serangan ini merupakan bagian dari praktik reverse-engineering, yakni upaya merekayasa ulang cara kerja logika model AI berpemilik agar dapat dikloning.

Informasi mengenai peretasan ini diungkap Google dalam sebauh laporan yang membahas berbagai bentuk aktivitas berbahaya dan penyalahgunaan terhadap Gemini.

Dalam laporan tersebut, Google menjelaskan bahwa serangan ribuan prompt itu bukan dilkaukan melalui peretasan konvensional seperti membobol sistem perusahaan.

Sebaliknya, pelaku (hacker) justru memanfaatkan akses resmi melalui API Gemini yang memang disediakan Google bagi pengembang perangkat lunak untuk membangun aplikasi berbasis chatbot.

Google menyebut, cara itu yang kemudian memungkinkan pelaku meluncurkan aksinya dengan berinteraksi secara sah dengan model AI, lalu secara bertahap mempelajari pola respons dan logika internal Gemini.

Seperti yang diketahui, dalam kondisi normal, AI Gemini hanya akan menampilkan jawaban akhir yang diberikan pengguna tanpa memperlihatkan proses penalaran di baliknya.

Namun kata Google, para hacker tersebut berupaya memaksa model untuk menampilkan seluruh proses penalaran tersebut melalui prompt yang disusun secara spesifik dan berulang.

Google Ilustrasi Gemini AI

Adapun salah satu prompt yang teridentifikasi Google yaitu, pelaku menginstruksikan Gemini untuk menggunakan bahasa dalam konten penalarannya sepenuhnya konsisten dengan bahasa utama pengguna.

Google mencatat, lebih dari 100.000 prompt dikaitkan langsung dengan upaya ekstraksi model tersebut, sebagaimana dihimpun KompasTekno dari PCMag.

Dinilai curi kekayaan intelektual

Menurut Google, aktivitas pembanjiran prompt tersebut dikategorikan sebagai bentuk pencurian kekayaan intelektual (intellectual property/IP). Perusahaan juga menegaskan, praktik tersebut telah melanggar ketentuan layanan (Terms of Service/ToS) layanan AI Gemini.

Atas pelanggaran itu, Google menyatakan bahwa pihaknya berhak mengambil tindakan dengan menghentikan akses ke pengguna yang terbukti terlibat. Google juga mengingatkan kepada pengembang AI lain untuk mewaspadai serangan ekstraksi model yang sama.

Meski dampaknya tidak langsung terasa, Google menilai bahwa serangan semacam ini berpotensi dimanfaatkan untuk kepentingan komersial maupun aktivitas siber yang berbahaya.

KOMPAS.com berkomitmen memberikan fakta jernih, tepercaya, dan berimbang. Dukung keberlanjutan jurnalisme jernih dan nikmati kenyamanan baca tanpa iklan melalui Membership. Gabung KOMPAS.com Plus sekarang