Bir yıl önce, Çinli yapay zeka start-up'ı DeepSeek, yapay zeka sektöründe bir şoka neden oldu: DeepSeek-R1 yapay zeka modeli, önemli ölçüde daha düşük bir fiyata en iyi ABD modelleriyle karşılaştırılabilir bir performans gösterdi ve borsada depreme neden oldu. Daha sonra DeepSeek-R1'in eğitiminin 300.000 dolardan daha az maliyetli olduğu ortaya çıktı. Artık yeni nesil DeepSeek v4 ön izleme olarak yayınlandı. Yeni amiral gemisi modeli, açık kaynak olarak hâlâ ücretsiz olarak sunuluyor ve Pro ve Flash versiyonları mevcut.
Duyurudan sonra devamını okuyun
Bu sefer çok büyük bir şok olmayabilir. DeepSeek bir kez daha açık kaynak alanında ön sıralarda yer alsa da, uzmanlar performansını göz hizasında değil, piyasadaki mutlak en iyi modellerin üç ila altı ay gerisinde görüyorlar. Ama en azından büyük fiyat avantajı devam ediyor. Pro modeli, API çağrıları söz konusu olduğunda DeepSeek v3.2'ye göre çok daha pahalıdır. Ancak bu hala OpenAI ve Anthropic tarafından teklif edilen fiyatların çok altında. Şirketin kıyaslama verilerine göre OpenAI'nin GPT-5.5'i, benzer kodlama görevleri için iki kat daha pahalı. Rekabetçi sprint artık bir maratona dönüşebilir. Çin'in açık kaynaklı yapay zekasına genel bir bakış, Çin'in açık kaynaklı yapay zekasının DeepSeek şokundan sonra genel olarak nasıl geliştiğini gösteriyor.
Kodlamada güçlü yönler, bilgide zayıf yönler
Arka planda çok şey yaşandı: V4, tamamen yeni mimarisi, sekiz kat daha uzun bağlam penceresi ve DeepSeek tarafından sağlanan belgelere göre önemli ölçüde iyileştirilmiş kodlama ve matematik düzeyleriyle gerçek bir nesil değişimidir.
V3.2'de 685 milyar parametre vardı; V4-Pro'nun rakamı 1,6 trilyon, yani iki katından fazla. Yeni model, bir milyona kadar bağlam belirteci (çok uzun belgeler, kod tabanları veya konuşmalar) işleyebilir ve önceki DeepSeek modellerinin hesaplama gücünün yalnızca küçük bir kısmını gerektirir. Karşılaştırma için: V3.2 maksimum 128.000 jetonu destekledi. Önceki model, uzun metinler için daha verimli bir dikkat mimarisi olan en önemli yenilik olan “DeepSeek Seyrek Dikkat”i (DSA) tanıttı. V4 bunun üzerine kuruludur ve iki yeni mekanizmayı birleştirir.
API fiyatları düşebilir
Elbette genel bilgide zayıflıklar var: Diğer üst düzey modellerin burada önemli ölçüde daha iyi olduğu söyleniyor. Modelin muhakeme yetenekleri artık önceki iki seviye yerine üç seviyede kontrol edilebiliyor: Sadece Düşün ve Düşünme yerine Düşünme, Düşünme ve Maksimum Düşünme. DeepSeek görünüşe göre esas olarak müşteri olarak geliştiriciler üzerine spekülasyon yapıyor: Yeni modelin sunumunda odak noktası esas olarak kıyaslama kodlaması, akıl yürütme ve aracı görevleridir. OpenAI ayrıca hedef grup olarak geliştiricilere giderek daha fazla odaklanıyor ve ChatGPT tarifelerini Codex kodlama aracı etrafında yeniden yapılandırdı. ABD modelleriyle karşılaştırıldığında olası tasarruf potansiyeli kesinlikle burada bazılarının ilgisini çekecektir.
Duyurudan sonra devamını okuyun
DeepSeek-V4-Pro'nun maliyeti milyon girdi tokenı başına 1,74 dolar ve çıktı tokenı başına 3,48 dolardır. Flash varyantının maliyeti bir milyon giriş tokenı başına 0,14 dolar ve bir milyon çıkış tokenı başına 0,28 dolardır. ABD iş medyası Bloomberg, DeepSeek'in şu anda bilgisayar sıkıntısı nedeniyle Pro modelinde kapasite darboğazı yaşadığını bildirdi. Yeni Huawei Ascend 950 kümelerinin yılın ikinci yarısındaki açığı kapatması bekleniyor. O zaman fiyatlar düşebilir.
Ayrıca bakınız:
(mki)

Bir yanıt yazın