AI Gemini 2.5 Computer Use Rilis, Bisa Buka Chrome, Isi Form, dan Belanja Otomatis

Kompas.com - 09/10/2025, 08:08 WIB
Galuh Putri Riyanto,
Reza Wahyudi

Tim Redaksi

KOMPAS.com - Google resmi memperkenalkan Gemini 2.5 Computer Use, model AI yang bisa berselancar (browsing) di internet seperti manusia.

Dikembangkan oleh divisi kecerdasan Google, DeepMind, Gemini 2.5 Computer Use memungkinkan AI membuka Google Chrome, mengetik keyword, mengeklik tombol, mengisi formulir, menggulir halaman web, hingga menavigasi situs web secara mandiri hanya dari satu perintah teks pengguna.

Model AI ini mirip dengan ChatGPT Agent buatan OpenAI yang mampu mengambil alih aplikasi di PC dan menjalankan tugas kompleks secara otomatis atas perintah pengguna.

Baca juga: OpenAI Rilis AI ChatGPT Agent, Bisa Operasikan PC dan Kerjakan Tugas Otomatis

Kehadiran model AI Gemini 2.5 Computer ini diumumkan lewat pengumuman di laman blog Google. CEO Google Sundar Pichai menyebut Gemini 2.5 Computer Use menetapkan standar baru pada berbagai tolok ukur dengan latensi yang lebih rendah.

“Ini baru permulaan, tapi kemampuan model untuk berinteraksi langsung dengan web, seperti menggulir, mengisi form, dan memilih menu dropdown, adalah langkah besar menuju terciptanya agen AI serbaguna,” tulis Pichai lewat platform X.

Diotaki Gemini 2.5 Pro

Ilustrasi model Gemini 2.5 Pro yang sudah tersedia secara publik dan bisa diakses melalui aplikasi Gemini, baik di Android, maupun iOSAndroid Central Ilustrasi model Gemini 2.5 Pro yang sudah tersedia secara publik dan bisa diakses melalui aplikasi Gemini, baik di Android, maupun iOS
Gemini 2.5 Computer Use dibangun di atas Gemini 2.5 Pro. Model bahasa besar yang dirilis pada Maret 2025 ini memiliki kemampuan penalaran (reasoning) dan jadi model paling cerdas dibanding sebelumnya.

Gemini 2.5 Pro yang ada di situs/aplikasi Gemini berfungsi sebagai asisten AI multimodal yang bisa menjawab pertanyaan, membuat dokumen, atau menganalisis gambar.

Berbeda dengan Gemini 2.5 Pro, Gemini 2.5 Computer Use hadir sebagai agen AI. yang . Jadi Gemini bisa mengeksekusi tindakan langsung di browser, tak lagi hanya membaca dan menjawab teks.

Contoh sederhananya, ketika pengguna mengetikkan perintah atau prompt “Cari hotel di pusat kota Bali yang punya kolam renang dan isi formulir pemesanan untuk 2 malam tanggal 15 Oktober”.

Gemini 2.5 Computer Use akan membuka browser virtual, mengetikkan pencarian, menavigasi situs, mengisi data di kolom pemesanan, bahkan mengonfirmasi langkah berikutnya. Semuanya secara otomatis, tanpa campur tangan pengguna.

Skenario penggunaan lainnya bisa untuk memproses formulir pelanggan, mencari informasi produk, atau menjadwalkan janji temu secara mandiri, memesan tiket konser, mencari resep, dan sebagainya.

Gemini 2.5 Computer Use juga bisa digunakan untuk pengujian aplikasi (UI testing) bagi pengembang software.

Baca juga: OpenAI Rilis Instant Checkout, Bisa Belanja Langsung di ChatGPT

Demo cara kerja Gemini 2.5 Computer Use bisa dilihat lewat video di bawah ini.

Untuk saat ini, model ini belum dirancang untuk mengakses sistem file lokal, jadi belum bisa membuat atau menyimpan dokumen di komputer pengguna secara langsung. Fokusnya masih pada navigasi web dan aplikasi berbasis antarmuka.

Google mengeklaim, setiap tindakan AI Gemini 2.5 Computer Use diawasi oleh lapisan keamanan tambahan (per-step safety service). Sistem ini mengevaluasi apakah perintah aman untuk dijalankan, terutama saat menyangkut transaksi, login, atau data sensitif.

Halaman:


Baca berita tanpa iklan. Gabung Kompas.com+
Unduh Kompas.com App untuk berita terkini, akurat, dan tepercaya setiap saat
QR Code Kompas.com
Arahkan kamera ke kode QR ini untuk download app
Baca berita tanpa iklan. Gabung Kompas.com+
Baca berita tanpa iklan. Gabung Kompas.com+
Komentar di Artikel Lainnya
Baca berita tanpa iklan. Gabung Kompas.com+
Bagikan artikel ini melalui
Oke
Login untuk memaksimalkan pengalaman mengakses Kompas.com
atau