KOMPAS.com - Google resmi memperkenalkan Gemini 2.5 Computer Use, model AI yang bisa berselancar (browsing) di internet seperti manusia.
Dikembangkan oleh divisi kecerdasan Google, DeepMind, Gemini 2.5 Computer Use memungkinkan AI membuka Google Chrome, mengetik keyword, mengeklik tombol, mengisi formulir, menggulir halaman web, hingga menavigasi situs web secara mandiri hanya dari satu perintah teks pengguna.
Model AI ini mirip dengan ChatGPT Agent buatan OpenAI yang mampu mengambil alih aplikasi di PC dan menjalankan tugas kompleks secara otomatis atas perintah pengguna.
Baca juga: OpenAI Rilis AI ChatGPT Agent, Bisa Operasikan PC dan Kerjakan Tugas Otomatis
Kehadiran model AI Gemini 2.5 Computer ini diumumkan lewat pengumuman di laman blog Google. CEO Google Sundar Pichai menyebut Gemini 2.5 Computer Use menetapkan standar baru pada berbagai tolok ukur dengan latensi yang lebih rendah.
“Ini baru permulaan, tapi kemampuan model untuk berinteraksi langsung dengan web, seperti menggulir, mengisi form, dan memilih menu dropdown, adalah langkah besar menuju terciptanya agen AI serbaguna,” tulis Pichai lewat platform X.
Our new Gemini 2.5 Computer Use model is now available in the Gemini API, setting a new standard on multiple benchmarks with lower latency. These are early days, but the model’s ability to interact with the web – like scrolling, filling forms + navigating dropdowns – is an… pic.twitter.com/4PJoat9bwI
— Sundar Pichai (@sundarpichai) October 7, 2025
Ilustrasi model Gemini 2.5 Pro yang sudah tersedia secara publik dan bisa diakses melalui aplikasi Gemini, baik di Android, maupun iOSGemini 2.5 Pro yang ada di situs/aplikasi Gemini berfungsi sebagai asisten AI multimodal yang bisa menjawab pertanyaan, membuat dokumen, atau menganalisis gambar.
Berbeda dengan Gemini 2.5 Pro, Gemini 2.5 Computer Use hadir sebagai agen AI. yang . Jadi Gemini bisa mengeksekusi tindakan langsung di browser, tak lagi hanya membaca dan menjawab teks.
Contoh sederhananya, ketika pengguna mengetikkan perintah atau prompt “Cari hotel di pusat kota Bali yang punya kolam renang dan isi formulir pemesanan untuk 2 malam tanggal 15 Oktober”.
Gemini 2.5 Computer Use akan membuka browser virtual, mengetikkan pencarian, menavigasi situs, mengisi data di kolom pemesanan, bahkan mengonfirmasi langkah berikutnya. Semuanya secara otomatis, tanpa campur tangan pengguna.
Skenario penggunaan lainnya bisa untuk memproses formulir pelanggan, mencari informasi produk, atau menjadwalkan janji temu secara mandiri, memesan tiket konser, mencari resep, dan sebagainya.
Gemini 2.5 Computer Use juga bisa digunakan untuk pengujian aplikasi (UI testing) bagi pengembang software.
Baca juga: OpenAI Rilis Instant Checkout, Bisa Belanja Langsung di ChatGPT
Demo cara kerja Gemini 2.5 Computer Use bisa dilihat lewat video di bawah ini.
Untuk saat ini, model ini belum dirancang untuk mengakses sistem file lokal, jadi belum bisa membuat atau menyimpan dokumen di komputer pengguna secara langsung. Fokusnya masih pada navigasi web dan aplikasi berbasis antarmuka.
Google mengeklaim, setiap tindakan AI Gemini 2.5 Computer Use diawasi oleh lapisan keamanan tambahan (per-step safety service). Sistem ini mengevaluasi apakah perintah aman untuk dijalankan, terutama saat menyangkut transaksi, login, atau data sensitif.