AI yarışı yoğunlaşırken Çin'in DeepSeek uzun zamandır beklenen V4 modelinin ön izlemesini yayınladı

DeepSeek logosu bir akıllı telefon ekranında, arka planda Çin bayrağıyla birlikte görülüyor.

Sopa Resimleri | Hafif Roket | Getty Images

Çinli yapay zeka girişimi DeepSeek, Cuma günü uzun zamandır beklenen V4 büyük dil modelinin ön izleme sürümünü yayımlayarak kullanıcıların yeni yeteneklerini ve özelliklerini test etmelerine olanak tanıdı.

Bu sürüm, Hangzhou merkezli şirketin şaşırtıcı performansı ve maliyet verimliliği nedeniyle küresel teknoloji pazarlarını sarsan R1 akıl yürütme modelini tanıtmasından bir yıldan fazla bir süre sonra geldi.

DeepSeek'in önceki model sürümlerine benzer şekilde, en son yükseltme açık kaynaktır ve geliştiricilerin kodu indirmesine, yerel olarak çalıştırmasına ve çoğu durumda değiştirmesine olanak tanır.

Modelin boyutuna bağlı olarak hem “pro” hem de “flash” versiyonu mevcuttur; DeepSeek, V4'ün özellikle aracı tabanlı görevler, bilgi işleme ve çıkarım konularında yerli rakiplere karşı güçlü bir performans elde ettiğini iddia etmektedir.

Counterpoint Research araştırmadan sorumlu başkan yardımcısı Neil Shah, CNBC'ye “DeepSeek'in V4 ön izlemesi ciddi bir esneklik sunuyor ve önceki modellere göre daha düşük çıkarım maliyetleri sunuyor” dedi.

Çıkarım maliyetleri, çıktı üretmek için eğitimli bir yapay zeka modelini çalıştırmanın hesaplama ve finansal giderlerini ifade eder.

DeepSeek ayrıca V4'ün Anthropic'in Claude Code ve OpenClaw gibi popüler aracı araçlarıyla kullanım için optimize edildiğini söyledi.

Counterpoint'in baş yapay zeka analisti Wei Sun'a göre V4'ün kıyaslama profili, “önemli ölçüde daha düşük maliyetle mükemmel temsilci yeteneği” sunabileceğini gösteriyor.

DeepSeek dünyayı yeniden şok edecek mi?

2023'te kurulan DeepSeek, 2024'ün sonlarında ücretsiz, açık kaynaklı V3 modeliyle dikkat çekti; bu modelin daha az güçlü çiplerle eğitildiğini ve OpenAI ve benzerleri tarafından oluşturulan modellerin maliyetinin çok altında bir maliyetle çalıştığını söyledi. Google.

Haftalar sonra, Ocak 2025'te, benzer kriterleri karşılayan veya dünyanın önde gelen LLM'lerinin çoğundan daha iyi performans gösteren R1 adlı bir akıl yürütme modeli yayınladı.

R1 modeli, DeepSeek'in daha düşük kapasiteli Nvidia yongaları kullanarak modeli oluşturmanın yalnızca iki ay sürdüğünü, hatta 6 milyon doları bile almadığını açıkladığında yatırımcıları alarma geçirdi. Bu, ABD'nin yapay zeka alanındaki liderliğinin yanı sıra Big Tech'in yapay zeka altyapısına yaptığı büyük harcamaları da sorguladı.

O zamandan bu yana DeepSeek bir dizi model yükseltmesi yayınladı ancak hiçbiri R1'in etkisine ulaşamadı.

Morningstar'ın kıdemli hisse senedi analisti Ivan Su, CNBC'ye verdiği demeçte, V4'ün piyasaya çıkışının R1 ile aynı pazar etkisine sahip olmasının pek mümkün olmadığını çünkü trader'ların Çin yapay zekasının rekabetçi ve kullanımının daha ucuz olduğu gerçeğini zaten fiyatlandırdıklarını söyledi.

Ancak Su, DeepSeek'in son konumlandırmasının diğer Çin açık kaynak modellerini doğrudan rakip haline getirdiğini söyledi.

“Bu, R1'de olmayan bir çerçevedir ve tek başına bu, yerel rekabetin ne kadar yoğunlaştığını gösterir” diye ekledi.

R1'in piyasaya sürülmesinden bu yana DeepSeek, Çin'in gelişen yapay zeka sektöründe artan rekabetle karşı karşıya kaldı. Alibaba'nın ve ByteDance de bu yıl yeni modeller yayınlıyor.

Diğer bazı Çinli AI oyuncularının hisseleri Cuma günü Hong Kong ticaretinde düşüş yaşadı. MiniMax ve Zhipu olarak da bilinen Bilgi Atlası Teknolojisi yaklaşık %8 oranında düşerken, Hangzhou merkezli geliştirici Manycore Tech %9 oranında düşüş yaşadı.

Hangi çipler V4'ü eğitti?

DeepSeek'in V4 modelinin piyasaya sürülmesiyle ilgili önemli bir soru, onu eğitmek ve desteklemek için hangi çiplerin kullanıldığıdır.

Çinli teknoloji devi Huawei Cuma günü, Ascend AI işlemcileri tarafından desteklenen en yeni AI bilgi işlem kümesinin DeepSeek'in V4 modelini destekleyebileceğini doğruladı.

Ancak, Amerikan AI çip liderininkilerle karşılaştırıldığında, Huawei'nin çiplerinin eğitimde ne kadar yaygın olarak kullanıldığı belirsizliğini koruyor. Nvidia.

Washington'un sürekli değişen ihracat kontrolleri nedeniyle Çinli geliştiricilerin Nvidia'nın en gelişmiş yapay zeka çiplerini doğrudan satın almaları kısıtlandı.

Bu arada Pekin, yerli çip endüstrisini geliştirme çabalarını hızlandırdı ve bildirildiğine göre Çinli teknoloji şirketlerini, Huawei gibi çip üreticilerinden gelen yerli alternatifleri benimsemeye zorladı.

Counterpoint'ten Wei Sun, V4'ün yerel çipler üzerinde yerel olarak çalışabilme yeteneğinin, Pekin'in daha fazla yapay zeka egemenliği elde etmesine ve Nvidia'ya bağımlılığı daha da azaltmasına yardımcı olarak çok büyük sonuçlar doğurabileceğini söyledi.

“Bu sonuçta küresel yapay zeka gelişmelerini de hızlandıracak” diye ekledi.

DeepSeek'in V4 sürümünü duyurmasının ardından Çinli sözleşmeli çip üreticilerinin hisseleri Hong Kong'da yükseldi. SMIC Ve Hua Hong Yarı İletken sırasıyla %9 ve %15 arttı.

Google'da tercih ettiğiniz kaynak olarak CNBC'yi seçin ve iş dünyasındaki haberlerin en güvenilir isminin hiçbir anını kaçırmayın.

Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir