Google DeepMind, çok modlu aracıların doğrudan standart dizüstü bilgisayarlarda etkinleştirilmesini amaçlayan yeni bir açık yapay zeka modeli olan Gemma 4 12B'yi tanıttı. 12 milyar parametreye sahip model, metni, görüntüleri ve bu boyuttaki ilk model olarak sesi yerel olarak işler ve yalnızca 16 GB RAM veya grafik belleği gerektirir. Apache 2.0 lisansı altında yayınlanan bu kitap, geliştiricilerin ve işletmelerin kullanımına ücretsiz olarak sunulmaktadır.
Duyurudan sonra devamını okuyun
Bu nedenle Google, yerel AI temsilcilerinin giriş engelini azaltıyor. Google'ın Gemini Intelligence yapay zekası Android akıllı telefonlardan yüksek donanım talepleri alırken, Gemma 4 12B özellikle genel halkı hedefliyor.
Ayrı kodlayıcısız mimari
Modelin ikinci gücü birleşik mimarisinde yatmaktadır. Google'ın blogunda açıkladığı gibi Gemma 4 12B, ayrı ses ve video kodlayıcılardan tamamen vazgeçiyor. Google'ın geleneksel çok modlu modelleri genellikle görüntü ve ses verilerini dil modeli bunları işlemeden önce çeviren kendi kodlayıcı modüllerini kullanır. Gemma 4 12B farklı bir yaklaşım benimsiyor: burada girdinin doğrudan LLM omurgası tarafından işlenmesi gerekiyor.
İki katı büyüklükte bir modele yakın performans
Google, Gemma 4 ailesi içinde 12B modelini akıllı telefonlar ve Raspberry Pi gibi IoT cihazları için tasarlanan E4B uç varyantları ile daha büyük olan 26B Uzmanlar Karışımı (MoE) modeli arasında konumlandırıyor. Ancak Google'a göre kıyaslamalarda daha güçlü modelin yalnızca biraz gerisinde kalıyor. Ancak özel bir GPU olmadan çıkarım sürelerinin daha uzun olması muhtemeldir.
Yeni modelin diğer satıcıların 16GB modelleriyle nasıl karşılaştırılacağı henüz belli değil.
Duyurudan sonra devamını okuyun
Güncelleme
12.19pm
Saat
Kısa anekdotsal testler, LM Studio tarafından sunulan 8 GB kapasiteli Qwen3/8B'deki eski Deepseek r1 sürümünden önemli ölçüde daha iyi hız gösterdi. Her iki model de GeoIP çözünürlüğü ve hava durumu gösterimi ile basit bir web sitesi oluşturma görevini tam 7 gün boyunca çözdü: Google modeli yaklaşık 10 dakikada, Deepseek-r1 ise bir saatten fazla sürede. Gemma 4 12B'nin token tüketimi çok daha ucuzdu: Yaklaşık 3.000 token gerekiyordu, Deepseek r1 damıtma ürünü ise yaklaşık 12.000 tokena ihtiyaç duyuyordu.
Kullanılan platform, oldukça sınırlı bilgi işlem kapasitesine sahip olan AMD Ryzen 7640HS Pro'ya sahip 64 GB'lık bir dizüstü bilgisayardı.

(tekrar)
Bir yanıt yazın