Intel’in hedefi maliyet etkinliği
Intel, Gaudi 3’ün fiyat-performans avantajına dikkat çekerek, Nvidia’nın H100 GPU’suna göre bazı senaryolarda daha hızlı ve ekonomik olduğunu savunuyor. Özellikle Llama 2 ve Llama 3 gibi farklı boyutlardaki modellerin çıkarım görevlerinde Gaudi 3’ün öne çıktığını belirtiyor. Ayrıca şirket, Gaudi 3’ün, küçük token çıktıları için büyük dil modelleri (LLM) çıkarımında H100 kadar enerji verimli olduğunu ve büyük token çıktılarında daha da iyi performans gösterdiğini iddia ediyor.
Ancak, Gaudi 3’ün genel olarak 16-bit ve 8-bit formatlarındaki kayan nokta işlemlerinde H100’e yetişemediği de kabul ediliyor. Intel’in açıklamalarına göre, Gaudi 3, bfloat16 ve 8-bit kayan nokta hassasiyetinde 1.835 TFLOPS seviyesine ulaşırken, H100 bu değerleri BF16 için 1.979 TFLOPS ve FP8 için 3.958 TFLOPS ile aşıyor.
Intel neden rekabet etmeyecek?
Intel’in bu stratejisinin mantıklı da bir açıklaması bulunuyor. Intel'in AI donanımlarından sorumlu ofis başkanı Anil Nanduri, performans yerine maliyetin öne çıktığı bir dünyaya doğru kaymanın başladığını belirtiyor. Nanduri, büyük bir model yerine daha küçük, görev odaklı modellerin tercih edileceğini savunarak, Gaudi 3 çiplerinin bu alanda uygun çözümler sunduğunu dile getiriyor. Nanduri’ye göre, birçok işletme için devasa bir modelin her şeyi bilmesinden ziyade, daha küçük ve daha az performans gerektiren modeller tercih edilecek.
Bu haberi, mobil uygulamamızı kullanarak indirip,istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
Heykel var yer misin kanka?
bizimkiler tahareti tartışıyor