Altı farklı çip, tek ekosistem
Rubin platformu toplam altı temel bileşenden oluşuyor. Bunlar 336 milyar transistörlü Rubin GPU, 227 milyar transistörlü Vera CPU, NVLink 6 bağlantı anahtarı, ConnectX-9 ve BlueField-4 ağ çözümleri ile Spectrum-X silikon fotonik altyapısı olarak sıralanıyor. Bu bileşenlerin tamamı DGX, HGX ve MGX sistemlerinde kullanılacak şekilde tasarlandı.
Sistemin merkezinde ise Nvidia'nın Vera Rubin Superchip adını verdiği çözüm yer alıyor. Bu yapı içerisinde iki Rubin GPU ve bir Vera CPU bulunuyor. Ayrıca yüksek kapasiteli HBM4 ve LPDDR5X bellekler de sistemin temel parçaları arasında yer alıyor.
Blackwell'in çok ötesine geçilecek
Rubin GPU, çip başına 22 TB/s HBM4 bant genişliği sunarken önceki nesle göre yaklaşık 2,8 kat daha yüksek veri aktarım kapasitesine ulaşıyor. Ayrıca GPU başına 3,6 TB/s NVLink bant genişliği sağlanıyor.
Nvidia'ya göre Vera CPU, Grace işlemcilerine kıyasla veri işleme, sıkıştırma ve CI/CD iş yüklerinde yaklaşık iki kat performans artışı sağlıyor.
Yeni ağ ve bağlantı teknolojileri de platformun parçası
Bu yıl müşterilere teslim edilecek
Bunun yanında LPDDR5X kapasitesi 54 TB'a, HBM4 kapasitesi ise 20,7 TB'a çıkıyor. HBM4 bant genişliği 1,6 PB/s seviyesine ulaşırken, ölçeklendirme bant genişliği de 260 TB/s olarak belirtiliyor.
Nvidia, yeni platformun yalnızca performans artışı sağlamayacağını, aynı zamanda yapay zeka ekonomisini de değiştireceğini savunuyor. Şirketin hesaplamalarına göre Rubin mimarisi, çıkarım işlemlerindeki token maliyetlerini 10 kat azaltabilecek. Ayrıca Mixture of Experts (MoE) modellerinin eğitimi için gereken GPU sayısının dört kat azaltılabileceği ifade ediliyor.
Nvidia, Vera Rubin platformunun ilk sistemlerini bu yıl müşterilere teslim etmeyi planlıyor. Platformun hem DGX SuperPOD altyapılarında hem de daha geniş veri merkezi kurulumlarında kullanılması bekleniyor.
Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:
çok güzel