KOMPAS.com - Google resmi merilis model kecerdasan buatan (AI) audio terbaru mereka, yakni Gemini 3.1 Flash Live. Model ini dirancang agar pengguna bisa "mengobrol" dengan AI secara lebih alami, layaknya berbicara dengan manusia.
Dalam posting blog resminya, Google menyebut bahwa Gemini 3.1 Flash Live merupakan model AI audio dan suara dengan kualitas tertinggi yang mereka miliki saat ini.
Google menjelaskan, model ini menghadirkan peningkatkan pada presisi serta latensi yang lebih rendah. Dengan begitu, respons suara yang dihasilkan menjadi lebih cepat, akurat, dan terasa natural.
Baca juga: Gemini AI Hadir di Google Maps, Bisa Jawab Pertanyaan Rumit dan Tampilan 3D Lebih Detail
Gemini 3.1 Flash Live juga dirancang untuk mendukung dialog real-time dengan ritme yang lebih mengalir.
Google mengeklaim, pengaturan ini bisa memberikan pengalaman interaksi yang intuitif bagi pengembang, perusahaan, dan pengguna umum.
Google menyebut kualitas keseluruhan Gemini 3.1 Flash Live telah ditingkatkan agar lebih andal dalam menangani tugas kompleks berskala besar, khususnya dalam percakapan berbasis suara.
Model AI ini disebut telah diuji menggunakan ComplexFunchBench Audio. Itu adalah benchmark AI yang digunakan untuk mengukur dan menguji kemampuan model dalam memahami instruksi kompleks, serta melakukan "function calling" (memanggil API/tool secara berurutan).
Hasilnya, model ini tercatat meraih skor 90,8 persen. Sebagai perbandingan, Audio MultiChallenge dari Scale AI, dengan mode "thinking" aktif, model AI audio Gemini 3.1 Flash Live meraih skor total 36,1 persen.
Benchmark ini menguji kemampuan mengikuti instruksi kompleks dan penalaran jangka panjang, di tengah gangguan dan jeda yang umum terjadi dalam percakapan audio di dunia nyata.
Baca juga: AI Gemini Masuk Google Docs hingga Sheets, Kerja Kantor Lebih Cepat
Google Search Live resmi tersedia di Indonesia. Fitur ini muncul dalam bentuk ikon Live di bawah kolom pencarian, berdampingan dengan tombol AI Mode dan Nano Banana.Dalam Gemini Enterprise for Customer Experience, model ini diklaim lebih peka dalam memahami nuansa suara dibandingkan model 2.5 Flash Native Audio. Adapun nuansa suara yang dimaksud yaitu nada (pitch) dan kecepatan bicara si pengguna.
Model ini juga disebut lebih mampu menyesuaikan respons sesuai dengan kondisi pengguna. Misalnya, saat pengguna terdengar bingung atau frustasi, Gemini 3.1 Flash Live akan memberikan jawaban yang lebih sesuai dengan situasi tersebut.
Gemini 3.1 Flash Live sendiri tersedia di berbagai layanan Google. Model ini digunakan di fitur Search Live dan Gemini Live untuk pengguna umum, serta dapat diakses oleh pengembang melalui Gemini Live API di Google Studio.
Untuk kebutuhan bisnis, model ini juga tersedia melalui layanan Gemini Enterprise for Customer Experience.
Google Search Live.Baca juga: AI Gemini 3.1 Flash-Lite Hadir, Google Janjikan Performa Cepat Harga Murah