Bagikan:

JAKARTA - Google kembali meng-upgrade kecerdasan buatan andalannya. Kali ini, perusahaan raksasa teknologi itu merilis pembaruan untuk Gemini 2.5 Flash Native Audio yang diklaim membuat percakapan dengan AI terasa lebih mulus, kontekstual, dan tidak lagi memotong pembicaraan pengguna di saat yang salah.

Dalam pengumuman yang dirilis pada 12 Desember 2025, Google menyebut pembaruan ini difokuskan untuk agen suara langsung atau live voice agents. Targetnya jelas: membuat interaksi manusia dengan mesin semakin mendekati obrolan natural antarmanusia, bukan lagi sekadar perintah kaku ala era awal asisten virtual.

Salah satu peningkatan utama ada pada kemampuan function calling. Gemini kini lebih presisi dalam menentukan kapan harus memanggil fungsi eksternal, seperti mengambil data real-time, lalu menyisipkannya langsung ke dalam respons audio tanpa merusak alur percakapan. Singkatnya, AI ini jadi lebih tahu kapan harus “cek dulu” sebelum menjawab, dan melakukannya tanpa terlihat berpikir keras.

Google juga meningkatkan kepatuhan Gemini terhadap instruksi pengembang. Tingkat akurasi dalam mengikuti instruksi kini mencapai 90%, naik dari sebelumnya 84%. Angka ini penting, terutama untuk alur kerja yang kompleks, di mana satu kesalahan kecil bisa membuat output AI melenceng jauh. Dalam bahasa sederhana: Gemini kini lebih patuh dan jarang ngeyel.

Dari sisi pengalaman pengguna, Gemini 2.5 Flash Native Audio kini lebih pintar mengingat konteks percakapan sebelumnya. Ini membuat dialog terasa lebih nyambung dan tidak mengulang-ulang topik seolah lupa apa yang baru saja dibahas. AI-nya masih mesin, tapi amnesia jangka pendek mulai ditinggalkan.

Josh Woodward, VP Google Labs, Gemini, dan AI Studio, menambahkan dua fitur kecil tapi krusial. Pertama, Gemini Live kini tidak akan langsung memotong pengguna hanya karena jeda bicara sedikit lebih lama. Kedua, pengguna bisa mematikan mikrofon saat Gemini sedang berbicara, sehingga tidak terjadi interupsi tak sengaja. Fitur sederhana, tapi sangat manusiawi.

Google menyebut pembaruan ini dirancang untuk meningkatkan kemampuan Gemini dalam menangani alur kerja kompleks, menavigasi instruksi pengguna, serta menjaga percakapan tetap natural. Update tersebut sudah mulai digulirkan ke Gemini Live, Search Live, Google AI Studio, dan Vertex AI.

Langkah ini menegaskan ambisi Google menjadikan Gemini bukan sekadar asisten digital, melainkan mitra percakapan yang bisa diajak diskusi tanpa drama. AI mungkin belum bisa basa-basi soal cuaca dengan penuh perasaan, tapi setidaknya sekarang ia tahu kapan harus diam, mendengarkan, lalu menjawab dengan relevan.