120 TFLOPS gücüyle A100'ü geride bırakabilir
Shaojun'un aktardığına göre çip, 14nm mantıksal birimlerin 18nm DRAM modülleriyle doğrudan birleştirilmesiyle tasarlanıyor. Bu yaklaşım, bellek bant genişliğinde belirgin bir artış sağlarken, hesaplama gecikmelerini de kayda değer ölçüde düşürüyor. Rakamlara gelirsek, sistemin toplamda 120 TFLOPS'luk hesaplama gücüne ulaştığı ve watt başına 2 TFLOPS verimlilik sunduğu paylaşıldı.
Bu değerler, teknik açıdan NVIDIA A100 hızlandırıcılarının üzerinde. Ancak mimari detayların açıklanmamış olması nedeniyle bu performansın hangi kullanım senaryoları için geçerli olduğu henüz netleşmiş değil. Yine de Çin, elde edilen sonuçların özellikle yapay zekâ eğitim süreçlerinde CUDA ekosistemine bağımlılığı azaltabileceğini söylüyor.
Aslına bakacak olursak, Çin’in üretim teknolojisi açısından 4nm ve altı süreçlerden hâlâ uzak olduğunu söyleyelim. Ancak bellek ve veri aktarım katmanında uyguladığı çözümlerle rekabeti farklı bir noktaya taşıyabilir.
Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin: