Mails-World – Raksasa teknologi Google secara resmi memperkenalkan inovasi terbaru dalam keluarga model kecerdasan buatan (AI) Gemini 2.5 series: Gemini 2.5 Flash Lite. Pengumuman ini dilakukan pada Selasa (17/6/2025), menandai langkah signifikan Google dalam pengembangan AI.
Google mengklaim Gemini 2.5 Flash Lite sebagai model AI tercepat sekaligus paling efisien dari segi biaya operasional dibandingkan model Gemini lainnya. Hal ini ditegaskan oleh Senior Director, Product Management Gemini, Tulsee Doshi, dalam blog resmi Google. “Kami juga memperkenalkan pratinjau untuk model Gemini 2.5 Flash Lite, model 2.5 paling cepat dan efisien secara biaya. Anda bisa mulai mengembangkan pratinjau untuk model terbaru dan kami menunggu saran dan masukan dari Anda,” ujar Doshi.
Meskipun belum tersedia secara publik dan masih dalam tahap pengembangan beta, model AI terbaru ini sudah dapat diakses oleh para pengembang (developers) melalui platform Google AI Studio atau Vertex AI. Kesempatan ini memungkinkan para pengembang untuk mulai bereksperimen dan memberikan umpan balik berharga kepada Google.
Merujuk pada pengumuman resmi Google, Gemini 2.5 Flash Lite menunjukkan peningkatan performa yang signifikan dibandingkan pendahulunya, Gemini 2.0 Flash Lite, dalam berbagai pengujian benchmarking. Peningkatan ini mencakup area krusial seperti pemrograman, penyelesaian soal matematika dan sains, logika penalaran, hingga penugasan multimoda.
Secara lebih spesifik, model ini mencatat skor tinggi dalam pengujian GPQA (Graduate-Level Google-Proof Q&A Benchmark/penyelesaian soal sains), AIME (American Invitational Mathematics Examination), dan LiveCodeBench (pengukuran kemampuan pengkodean LLM dalam konteks pemrograman). Skor pengujian ini secara konsisten melampaui Gemini 2.0 Flash Lite. Bahkan, dalam beberapa pengujian seperti penalaran visual, performa multi-lingual, dan AIME 2025, skornya nyaris bersaing ketat dengan model Gemini 2.5 Flash standar.
Salah satu keunggulan utama model AI terbaru ini adalah efisiensi biayanya yang sangat rendah. Untuk mode Standard, biaya yang dibutuhkan sekitar 0,10 dollar AS (sekitar Rp 1.631) per juta token, sementara mode Thinking membutuhkan sekitar 0,40 dollar AS (sekitar Rp 6.527) per juta token output. Meski demikian, seperti dikutip KompasTekno dari The Decoder, biaya mode Thinking akan lebih besar untuk menghasilkan pemaparan yang lebih akurat, dan biaya penggunaan aktual dapat bervariasi.
Dengan kombinasi performa tinggi dan biaya rendah, Gemini 2.5 Flash Lite sangat cocok untuk tugas-tugas berbobot tinggi dan berlatensi rendah, seperti penerjemahan teks antar bahasa atau klasifikasi data. Ini didukung oleh skor benchmark tinggi pada pengujian FACTS Grounding (86,8%), yang mengukur kemampuan model bahasa besar (LLM) dalam merespons informasi faktual dan terverifikasi untuk mengurangi ‘halusinasi’ informasi, serta Multilingual MMLU (84,5%), indikator pengetahuan umum dan penalaran model di berbagai bahasa dan domain.
Selain itu, Gemini 2.5 Flash Lite juga mencatat skor tinggi dalam pengujian penalaran visual (Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark/MMMU) sebesar 72,9%, dan 57,5% untuk penalaran visual serta pemahaman gambar. Seperti anggota keluarga Gemini 2.5 series lainnya, model AI ini juga mendukung input multi-modal yang terintegrasi, termasuk fitur seperti Google Search, eksekusi kode, dan pemahaman terhadap konteks.
Sejalan dengan pengenalan Gemini 2.5 Flash Lite, Google juga mengumumkan bahwa model Gemini 2.5 Flash dan Gemini 2.5 Pro kini telah resmi dapat diakses publik. Kedua model ini sebelumnya telah menunjukkan skor benchmark yang impresif dan kini tersedia baik di perangkat Android maupun iOS melalui aplikasi Gemini.
Seluruh anggota keluarga Gemini 2.5 dirancang dengan konsep penalaran hibrida, sebuah sistem yang menggabungkan berbagai pendekatan pemecahan masalah mulai dari logika hingga metode statistik. Integrasi ini memungkinkan model kecerdasan buatan untuk menghasilkan solusi yang lebih akuntabel dan optimal untuk tugas-tugas kompleks. Strategi ini juga bertujuan untuk menyeimbangkan kinerja tinggi dengan biaya dan latensi yang rendah, memposisikan ketiga model Gemini 2.5 sebagai bagian dari Pareto Front.
Tulsee Doshi menjelaskan, “Kami mendesain Gemini 2.5 menjadi keluarga dari model penalaran hibrida dengan performa yang menakjubkan, sekaligus menerapkan Pareto Front untuk mengutamakan kecepatan dan efisiensi biaya.” Dalam konteks AI, Pareto Front merujuk pada kemampuan memberikan solusi optimal pada permasalahan optimasi multi-objektif, di mana perbaikan satu aspek mungkin mengorbankan aspek lain. Model ini memungkinkan pengguna mendapatkan solusi paling efektif atau sesuai prioritas di antara tujuan yang bertentangan, guna mengoptimalkan efisiensi dan kapabilitas model yang dirilis.