2028 yılından sonra geliyor
GPU uzmanı AGF'ye göre Nvidia, LPU entegrasyonu için AMD'nin X3D işlemcilerde kullandığı yaklaşıma benzer bir yol izleyebilir. Buna göre LPU birimleri, ana hesaplama kalıbından ayrı birer yonga olarak tasarlanacak ve TSMC'nin SoIC hibrit bağlama teknolojisiyle Feynman GPU'ların üzerine istiflenecek. Bu sayede, yüksek bant genişliği ve paket dışı belleğe kıyasla daha düşük enerji tüketimi hedefleniyor.
TSMC'nin hibrit bağlama teknolojisi burada kritik bir rol üstleniyor. A16 sürecinin sunduğu arka yüz güç dağıtımı sayesinde, ön yüzey dikey SRAM bağlantıları için kullanılabiliyor. Bu yapı, düşük gecikmeli veri erişimi ve çıkarım senaryolarında daha hızlı yanıt süreleri sunabilir. Ancak bu yaklaşımın ciddi mühendislik zorlukları da bulunuyor.
LPU, X3D ve dahası
Yüksek hesaplama yoğunluğuna sahip bir GPU'nun üzerine ek yongalar istiflemek, termal sınırların yönetimini zorlaştırabilir. Özellikle sürekli yüksek iş hacmiyle çalışan LPU'ların, ısı ve darboğaz risklerini artırabileceği belirtiliyor. Ayrıca LPU'ların sabit yürütme düzenine sahip olması, GPU'ların esnek ve paralel yapısıyla çelişen bir yapı oluşturuyor.
Yazılım tarafında ise CUDA ekosistemi önemli bir soru işareti. LPU tarzı yürütme, açık bellek yerleşimi gerektirirken CUDA çekirdekleri donanım soyutlaması üzerine inşa ediliyor. Bu iki yaklaşımın uyumlu hâle getirilmesi, Nvidia açısından yalnızca donanım değil, yazılım tarafında da optimizasyon gerektirecek. Ancak LPU entegrasyonu gerçekleşirse, yalnızca ham performans değil, yapay zekâ çıkarım iş yüklerinde mimari düzeyde yeni bir sayfa açabilir.