Nvidia, CES açılış konuşmasında yeni nesil yapay zeka sunucuları DGX Vera Rubin'i tanıttı. Hepsi halihazırda Nvidia'nın laboratuvarlarında çalışan altı özel çipten oluşuyor. Bitmiş sistemlerin pazara sunulmasının 2026 yılının ikinci yarısına kadar gerçekleşmesi planlanmıyor.
Reklamdan sonra devamını okuyun
Sunucunun kalbi Nvidia'nın yeni Ruby GPU mimarisidir. Bu, GB200'den DGX Spark'a ve GeForce RTX 5000'e kadar tüm mevcut ürünlerde kullanılan Blackwell'i takip ediyor. Nvidia patronu Jensen Huang'ın yanında yeni mimari hakkında herhangi bir ayrıntı yoktu, yalnızca seçilmiş önemli rakamlar vardı: Rubin'in şirket içi NVFP4 veri formatında 50 petaflop'u devirmesi bekleniyor, bu da Blackwell ile karşılaştırıldığında 5 faktörüne karşılık geliyor.
CPU için Olympus çekirdekleri
ARM işlemci Vera hakkında birkaç detay daha vardı. Selefi Grace'in aksine, bu, kullanıma hazır Neoverse çekirdeklerini değil, kendi geliştirdiği Olympus çekirdeklerini kullanıyor. 176 iş parçacığını paralel olarak işleyen işlemcide bunlardan 88 tanesi bulunmaktadır. Bu, geleneksel bir SMT'yi değil, Nvidia'nın “Uzamsal Çoklu İş Parçacığı” adını verdiği bir şeyi kullanır. Raporlara göre, gelen iş parçacıkları dönüşümlü olarak dahili bağlantı noktalarına dağıtılıyor. Nvidia'nın 2025 yılından bu yana açık kaynak kodlu derleyicilere kadar CPU dahilileri üzerinde çalıştığı için Vera'nın ARM V9.2 komut setini destekleyeceği biliniyor. Edindiğimiz bilgilere göre IP guardian ARM'ın resmi sertifikası halen beklemede.

(Resim: Florian Müssig / Haberler medien)
Ortalama olarak Vera Rubin, önceki GB200 (Grace Blackwell) ile dörtte bir GPU ile aynı bilgi işlem gücünü sunmalıdır; Token başına maliyet yalnızca yedide biri olmalıdır. Nvidia'nın, Mart ayında yapılması planlanan GTC kurum içi sergisindeki sunumlar için Vera ve Rubin ve bunların özel uygulamaları hakkında daha ayrıntılı ayrıntıları saklaması muhtemeldir.
AI sunucusu DGX Vera Rubin bu iki çipten fazlasını içeriyor. Bunlar, düzinelerce GPU'yu birbirine bağlamak için bu tür dört anahtar çipi içeren bir NVLink yuvasıyla NVLink 6 kullanılarak birbirine bağlanır. Halen NVL72 olarak adlandırılan planlanan ağda (Nvidia, daha önce planlanan NVL144 adını reddetmişti), 72 GPU nihayet ortak bir bilgi işlem birimi oluşturacak şekilde bağlanıyor.
Yeni şirket içi ağ kartları Connect-X 9, Bluefield 4 veya Spectrum-X, dış dünyayla bağlantıyı üstleniyor. İkincisi, Silicon Photonics'i, yani doğrudan ağ çipine fiber optik bağlantı kullanır.
Reklamdan sonra devamını okuyun

(Resim: Florian Müssig / Haberler medien)
Üçüncü NVL72 derlemesi olan DGX Vera Rubin ile Nvidia, yalnızca bilgi işlem gücünü artırmakla kalmıyor, aynı zamanda veri merkezlerindeki teknisyenlerin işini de kolaylaştırmak istiyor. Bunu başarmak için Nvidia, bakım çalışmaları sırasında yolunuza çıkabilecek kablolardan tamamen vazgeçiyor. Üstelik sistemin kendisi çalışmaya devam ederken hatalı bileşenler çalışma sırasında değiştirilebilir. Tüm bunlar, bir hata durumunda büyük zaman tasarrufu sağlıyor: Nvidia'ya göre, bir NVLink tepsisi artık yalnızca altı dakikada değiştirilebiliyor; önceki modelde aynı işlem 100 dakika sürüyordu.
Depolama ara katmanı
Son olarak DGX Vera Rubin, yapay zeka modellerinin pratik kullanımda (çıkarım) çalıştığı bağlamın giderek büyümesi ve depolama alt sistemine yönelik bant genişliğinin uzun süredir bir darboğaz olması sorununu ele alıyor. Bu nedenle yeni DGX nesli, Spectrum-X SSD'leri kullanarak bilgi işlem düğümlerine özellikle hızlı bir şekilde bağlanan, Anlamlı Bağlam Bellek Depolama Platformu adını taşıyan bir ara katman içerir. Bu, gerçek hesap makinelerinin gerekli verilere 20 kata kadar daha hızlı erişebileceği anlamına gelir.
Yeni yapay zeka modelleri
Yazılım tarafında Jensen Huang yeni açık kaynaklı modeller sözü verdi. Nemotron, Cosmos ve Groot için yeni versiyonlar ve hatta Alpamayo ile tamamen yeni bir model var. Alpamayo, otonom araçlara yönelik bir akıl yürütme modelidir; böylece Seviye 4 tanımına göre, açıkça eğitilmedikleri beklenmedik durumlarla da başa çıkabilirler. Nvidia buna örnek olarak trafik ışıklarının arızasını gösterdi; bunun gibi bir şey yakın zamanda Waymo'nun San Francisco'daki otonom filosunu felç etti.

(Resim: Florian Müssig / Haberler medien)
Haberler Medien, CES 2026'nın resmi medya ortağıdır.
(mue)
Bir yanıt yazın