![]() |
cover | @google |
Gemini 2.5 Flash dibangun di atas fondasi Flash 2.0, model yang sudah dikenal karena kecepatan dan efisiensinya. Versi 2.5 tidak hanya mempertahankan keunggulan tersebut, tapi juga menghadirkan peningkatan signifikan dalam kemampuan penalaran, menjadikannya model yang lebih adaptif untuk berbagai kasus penggunaan kompleks.
"Kami gembira meluncurkan versi awal Gemini 2.5 Flash hari ini dalam pratinjau di Gemini API melalui Google AI Studio dan Vertex AI. Berdasarkan fondasi populer Flash 2.0, versi baru ini menghadirkan peningkatan besar dalam kemampuan penalaran, sembari tetap memprioritaskan kecepatan dan biaya," tulis Google dalam pengumuman resminya, Jumat (18/4/2025).
Salah satu keunggulan utama dari Gemini 2.5 Flash adalah rasio kinerja terhadap biaya yang luar biasa. Google menyatakan bahwa model ini berada di perbatasan pareto, artinya ia mencapai efisiensi maksimal dalam performa dan biaya tanpa mengorbankan salah satu aspek secara signifikan.
Menariknya, ini adalah model pertama Google yang menerapkan pendekatan penalaran hibrida penuh. Pengembang kini memiliki kemampuan untuk mengaktifkan atau menonaktifkan 'pemikiran', sebuah fitur yang memungkinkan mereka mengontrol proses reasoning model demi menyesuaikan antara kecepatan, kualitas, dan latensi.
Fitur pengaturan anggaran pemikiran juga menjadi sorotan penting. Dengan fitur ini, pengembang dapat menetapkan batasan pemrosesan logika atau reasoning sesuai kebutuhan aplikasi mereka. Ini membantu dalam mengoptimalkan penggunaan sumber daya dan hasil keluaran AI secara lebih presisi.
Meski reasoning dinonaktifkan, Gemini 2.5 Flash tetap mempertahankan kecepatan yang dikenal dari versi 2.0. Namun, dengan peningkatan arsitektur dan algoritma, kinerjanya justru mengalami peningkatan meski dalam kondisi minimal reasoning. Ini menunjukkan efisiensi teknis yang sangat tinggi dari tim pengembang Google.
Google menyampaikan antusiasmenya untuk melihat bagaimana para pengembang memanfaatkan Gemini 2.5 Flash dalam berbagai skenario aplikasi nyata. Umpan balik dari komunitas sangat diharapkan untuk terus menyempurnakan model ini ke depannya.
Penalaran hibrida penuh.
"Model Flash 2.5 kami yang baru memiliki rasio kinerja terhadap biaya yang luar biasa, yang menempatkannya di perbatasan pareto. Ini adalah model penalaran hibrida penuh pertama kami, yang memungkinkan pengembang untuk mengaktifkan atau menonaktifkan pemikiran, dan menetapkan anggaran pemikiran untuk mengoptimalkan keseimbangan antara kualitas, biaya, dan latensi," ungkapnya.
Tidak hanya tersedia bagi pengembang, Gemini 2.5 Flash kini juga bisa digunakan oleh publik secara langsung melalui aplikasi Gemini. Ini membuka akses lebih luas kepada siapa saja yang ingin mengeksplorasi kecanggihan AI generatif dari Google.
Model ini juga mendukung fitur baru bernama Canvas, sebuah ruang interaktif yang dirancang untuk membantu pengguna dalam menyusun dan menyempurnakan dokumen maupun kode. Dengan Canvas, kolaborasi dengan AI menjadi lebih alami dan produktif.
Dengan semua peningkatan ini, Gemini 2.5 Flash menjadi representasi terbaru dari visi Google dalam membangun AI yang cepat, cerdas, dan efisien. Peluncuran versi awal ini menandai langkah penting menuju AI yang lebih bisa disesuaikan dengan kebutuhan nyata pengguna dan pengembang.
"Bahkan dengan menonaktifkan pemikiran, pengembang dapat mempertahankan kecepatan Flash 2.0 dan meningkatkan kinerja. Kami tidak sabar untuk melihat bagaimana Anda menggunakan Gemini 2.5 Flash di aplikasi Anda, dan untuk mendapatkan umpan balik Anda," jelasnya.
Gemini 2.5 Flash juga tersedia untuk semua pengguna di aplikasi Gemini , dan dapat digunakan dengan fitur baru seperti Canvas, ruang interaktif untuk menyempurnakan dokumen dan kode pengguna.