Gemini 3 Flash, Bu Önemli Karşılaştırmalarda Gemini 3 Pro ve GPT 5.2'den daha iyi performans gösteriyor


Yapay zeka savaşları kızışmaya devam ediyor. OpenAI'nin Google'a karşı yarışında “kırmızı kod” ilan etmesinden sadece birkaç hafta sonra, Google en son hafif modeli olan Gemini 3 Flash'ı piyasaya sürdü. Bu özel Flash, Google'ın Gemini 3 Pro ve Gemini 3 Deep Think ile başlayan Gemini 3 ailesinin en son üyesidir. Ancak bu son modelin mevcut Gemini 3 modellerinin daha hafif ve daha ucuz bir çeşidi olması amaçlanmış olsa da Gemini 3 Flash aslında kendi başına oldukça güçlüdür. Aslında bazı kıyaslamalarda hem Gemini 3 Pro'yu hem de OpenAI'nin GPT-5.2 modellerini geride bırakıyor.

Hafif modeller genellikle daha temel sorgular, daha düşük bütçeli istekler veya daha düşük güçlü donanımlarda çalıştırılmak üzere tasarlanmıştır. Bu, işlenmesi daha uzun süren ancak daha fazlasını yapabilen daha güçlü modellerden genellikle daha hızlı oldukları anlamına gelir. Google'a göre Gemini 3 Flash, bu iki dünyanın en iyi yönlerini birleştirerek Gemini 3'ün “Pro düzeyinde mantığına” ve “Flash düzeyinde gecikme, verimlilik ve maliyete” sahip bir model üretiyor. Bu muhtemelen geliştiriciler için en önemli şey olsa da, Gemini 3 Flash artık hem Gemini (sohbet robotu) hem de Google'ın yapay zeka destekli araması AI Modu için varsayılan olduğundan genel kullanıcıların da iyileştirmeleri fark etmesi gerekir.

Gemini 3 Flash performansı

Bu iyileştirmeleri Google'ın Gemini 3 Flash için rapor ettiği kıyaslama istatistiklerinde görebilirsiniz. LLM'leri 100'den fazla konuda 2.500 soru üzerinde test eden akademik bir muhakeme ölçütü olan Humanity's Last Exam'de Gemini 3 Flash, hiçbir araç olmadan %33,7 ve arama ve kod yürütme ile %43,5 puan aldı. Bunu Gemini 3 Pro'nun sırasıyla %37,5 ve %45,8 puanlarıyla veya OpenAI'nin GPT-5.2'nin %34,5 ve %45,5 puanlarıyla karşılaştırın. Bir modelin çok modlu anlayışını ve muhakemesini test eden bir kıyaslama olan MMMU-Pro'da Gemini 3 Flash, Gemini 3 Pro (%81) ve GPT-5.2 (%79,5) ile karşılaştırıldığında en yüksek puanı (%81,2) aldı. Aslında, Google'ın duyurusunda vurguladığı 21 kıyaslama testi arasında Gemini 3 Flash üç testte en yüksek puanı aldı: MMMU-Pro (Gemini 3 Pro ile beraber), Toolathlon ve MMMLU. Gemini 3 Pro, buradaki çoğu testte (14) hala birinci sırada yer alıyor ve GPT-5.2 sekiz testin zirvesinde yer alıyor, ancak Gemini 3 Flash liderliğini koruyor.

Google, Gemini 3 Flash'ın, modelin kodlama aracısı yeteneklerini test eden SWE-bench Verified karşılaştırmasında hem Gemini 3 Pro'dan hem de 2.5 serisinin tamamından daha iyi performans gösterdiğini belirtiyor. Gemini 3 Flash %78, Gemini 3 Pro %76,2, Gemini 2.5 Flash %60,4 ve Gemini 2.5 Pro %59,6 puan aldı. (GPT-5.2'nin, Google'ın bu duyuruda bahsettiği modeller arasında en iyi puanı aldığını unutmayın.) Özellikle bunun, şirketin amiral gemisi modelleriyle birlikte puan alan hafif bir model olduğunu düşündüğünüzde, bu yakın bir yarış.

Gemini 3 Flash'ın maliyeti

Bu, programlarında yapay zeka modellerini kullanmak için para ödeyen geliştiriciler için ilginç bir ikilem oluşturabilir. Gemini 3 Flash'ın maliyeti, her milyon giriş jetonu başına 0,50 USD (modelden yapmasını istediğiniz şey) ve her milyon çıkış jetonu başına 3,00 USD'dir (modellerin isteminizden döndürdüğü sonuç). Bunu, her bir milyon giriş jetonu başına 2,00 ABD Doları ve her bir milyon çıkış jetonu başına 12,00 ABD Doları veya GPT-5.2'nin sırasıyla 3,00 ABD Doları ve 15,00 ABD Doları maliyeti olan Gemini 3 Pro ile karşılaştırın. Değeri ne olursa olsun, Gemini 2.5 Flash (0,30 $ ve 2,50 $) veya Grok 4.1 Fast (0,20 $ ve 0,50 $) kadar ucuz değil, ancak Google'ın rapor ettiği kıyaslamalarda bu modellerden daha iyi performans gösteriyor. Google, Gemini 3 Flash'ın 2.5 Pro'ya göre ortalama %30 daha az token kullandığını, bunun da maliyetten tasarruf edeceğini ve aynı zamanda üç kat daha hızlı olacağını belirtiyor.

Ürünlerinizi güçlendirmek için Gemini 3 Flash gibi Yüksek Lisans'lara ihtiyaç duyan biriyseniz ancak daha güçlü modellerle ilgili daha yüksek maliyetleri ödemek istemiyorsanız, bu en son hafif modelin finansal açıdan çekici göründüğünü hayal edebilirim.

Ortalama bir kullanıcı Gemini 3 Flash'ı nasıl deneyimleyecek?

Yapay zeka kullanan çoğumuz, API fiyatlandırması konusunda endişelenmesi gereken geliştiriciler olarak bunu yapmıyoruz. Gemini kullanıcılarının çoğunluğu muhtemelen modeli Google'ın Arama, Çalışma Alanı ve Gemini uygulaması gibi tüketici ürünleri aracılığıyla deneyimliyor.

Şu ana kadar ne düşünüyorsun?

Bugünden itibaren Gemini 3 Flash, Gemini uygulamasında varsayılan model olacaktır. Google, birçok görevi “sadece birkaç saniye içinde” gerçekleştirebileceğini söylüyor. Bu, Gemini'den kendi videonuza dayanarak golf vuruşunuzu geliştirmeyle ilgili ipuçları istemeyi veya belirli bir tarihi konu hakkında bir konuşma yükleyip kaçırmış olabileceğiniz gerçekleri talep etmeyi içerebilir. Ayrıca bottan size bir dizi düşünceden yola çıkarak çalışan bir uygulamayı kodlamasını da isteyebilirsiniz.

Ayrıca Gemini 3 Flash'ı Google Arama'nın Yapay Zeka Modunda da deneyimleyeceksiniz. Google, yeni modelin “sorunuzdaki nüansları ayrıştırmada” daha iyi olduğunu ve isteğinizin her bölümünü enine boyuna düşündüğünü söylüyor. AI Modu, yüzlerce siteyi aynı anda tarayarak ve cevabınız için kaynaklarla birlikte bir özet oluşturarak daha eksiksiz bir arama sonucu döndürmeye çalışır. Gemini 3 Flash'ın AI Modunun önceki yinelemelerine göre gelişip gelişmediğini görmemiz gerekecek.

Ben günlük yaşamlarında üretken yapay zeka ürünlerini hâlâ pek kullanmayan biriyim ve Gemini 3 Flash'ın bunu benim için değiştireceğinden tam olarak emin değilim. Ancak, performans kazanımları ile bu gücü işleme maliyeti arasındaki denge ilginç ve OpenAI'nin nasıl tepki vereceğini özellikle merak ediyorum.

Gemini 3 Flash bugünden itibaren tüm kullanıcıların kullanımına sunuldu. Gemini ve AI Modundaki genel kullanıcılara ek olarak, geliştiriciler bunu Google AI Studio, Gemini CLI ve şirketin yeni aracı geliştirme platformu olan Google Antigravity'deki Gemini API'sinde bulacaklar. Kurumsal kullanıcılar bunu Vertex AI ve Gemini Enterprise'da kullanabilir.


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir