Google, dizüstü bilgisayarlara 12 milyar parametreli model getiriyor

kapanış bildirimi

Bu makale İngilizce olarak da mevcuttur. Teknik yardımla tercüme edildi ve yayınlanmadan önce editoryal olarak gözden geçirildi.

Google DeepMind, çok modlu aracıların doğrudan standart dizüstü bilgisayarlarda etkinleştirilmesini amaçlayan yeni bir açık yapay zeka modeli olan Gemma 4 12B'yi tanıttı. 12 milyar parametreye sahip model, metni, görüntüleri ve bu boyuttaki ilk model olarak sesi yerel olarak işler ve yalnızca 16 GB RAM veya grafik belleği gerektirir. Apache 2.0 lisansı altında yayınlanan bu kitap, geliştiricilerin ve işletmelerin kullanımına ücretsiz olarak sunulmaktadır.

Duyurudan sonra devamını okuyun

Bu nedenle Google, yerel AI temsilcilerinin giriş engelini azaltıyor. Google'ın Gemini Intelligence yapay zekası Android akıllı telefonlardan yüksek donanım talepleri alırken, Gemma 4 12B özellikle genel halkı hedefliyor.

Modelin ikinci gücü birleşik mimarisinde yatmaktadır. Google'ın blogunda açıkladığı gibi Gemma 4 12B, ayrı ses ve video kodlayıcılardan tamamen vazgeçiyor. Google'ın geleneksel çok modlu modelleri genellikle görüntü ve ses verilerini dil modeli bunları işlemeden önce çeviren kendi kodlayıcı modüllerini kullanır. Gemma 4 12B farklı bir yaklaşım benimsiyor: burada girdinin doğrudan LLM omurgası tarafından işlenmesi gerekiyor.

Google, Gemma 4 ailesi içinde 12B modelini akıllı telefonlar ve Raspberry Pi gibi IoT cihazları için tasarlanan E4B uç varyantları ile daha büyük olan 26B Uzmanlar Karışımı (MoE) modeli arasında konumlandırıyor. Ancak Google'a göre kıyaslamalarda daha güçlü modelin yalnızca biraz gerisinde kalıyor. Ancak özel bir GPU olmadan çıkarım sürelerinin daha uzun olması muhtemeldir.

Yeni modelin diğer satıcıların 16GB modelleriyle nasıl karşılaştırılacağı henüz belli değil.

Duyurudan sonra devamını okuyun


Güncelleme

12.19pm

Saat

Kısa anekdotsal testler, LM Studio tarafından sunulan 8 GB kapasiteli Qwen3/8B'deki eski Deepseek r1 sürümünden önemli ölçüde daha iyi hız gösterdi. Her iki model de GeoIP çözünürlüğü ve hava durumu gösterimi ile basit bir web sitesi oluşturma görevini tam 7 gün boyunca çözdü: Google modeli yaklaşık 10 dakikada, Deepseek-r1 ise bir saatten fazla sürede. Gemma 4 12B'nin token tüketimi çok daha ucuzdu: Yaklaşık 3.000 token gerekiyordu, Deepseek r1 damıtma ürünü ise yaklaşık 12.000 tokena ihtiyaç duyuyordu.

Kullanılan platform, oldukça sınırlı bilgi işlem kapasitesine sahip olan AMD Ryzen 7640HS Pro'ya sahip 64 GB'lık bir dizüstü bilgisayardı.

Test sonucunun ekran görüntüsü



(tekrar)


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir