Tam Boyutta Gör Yapay zekâ donanımı denildiğinde bugün akla ilk olarak GPU’lar geliyor. Özellikle Nvidia ve AMD gibi şirketlerin ürettiği grafik işlemciler, hem yapay zekâ hem de yüksek performanslı hesaplama (HPC) tarafında fiilî standart hâline gelmiş durumda. Diğer yandan Google’ın TPU’ları ve büyük bulut sağlayıcılarının geliştirdiği özel yapay zekâ ASIC’leri ise daha dar ama daha verimli kullanım senaryolarında öne çıkıyor. Ancak son günlerde adından söz ettirmeye başlayan Taalas adlı girişim, yavaş yavaş kemikleşmeye başlayan sektörde tüm dengeleri alt üst edebilir.

Taalas, Her Model İçin Özel Bir Çip Tasarlayarak Performansı Zirveye Taşıyor

Yaklaşık iki buçuk yıl önce kurulan Taalas, “Hardcore AI” adını verdiği mimariyle yapay zekâ modellerini doğrudan silikona gömmeyi öneriyor. Şirketin yaklaşımı, bir modeli GPU üzerinde çalıştırmak yerine, o modelin parametrelerini ve ağırlıklarını fiziksel olarak çipe “gömmek” üzerine kurulu. Yani klasik anlamda yazılımın donanım üzerinde çalışması yerine, modelin kendisi donanım hâline geliyor. Bu yaklaşım ile ortaya çıkarılan ilk ürün olan HC1 adlı ASIC (Application-Specific Integrated Circuit, yani belirli bir amaca özel tasarlanmış entegre devre), gerçekten etkileyici bir performans ortaya koyuyor.

Bugün yapay zekâ tarafında başlıca çözüm hâline gelen GPU’lar, görece esnek platformlar sunuyor ve farklı modelleri, farklı iş yüklerini çalıştırabiliyor. Ancak bu esneklik performans ve verimlilikten fedakârlık anlamına gelir. Öte yandan yalnızca belirli yapay zekâ iş yükleri için tasarlanan ASIC’ler çok daha verimli olabiliyor, ama genel amaçlı kullanımda yetersiz kalıyor. Taalas ise bu özelleşmeyi bir adım daha ileri taşıyor: Her çip yalnızca tek bir model için tasarlanıyor.

Taalas, Kendi Çiplerinin GPU'lardan 100 Kat Daha Hızlı Olduğunu İddia Ediyor

İlk örnek, Meta’nın açık kaynaklı Llama 3.1 8B modeli üzerine inşa edilmiş. Şirket, yeni bir model çıktığında bu modele özel donanımı iki ay içinde üretebildiğini söylüyor. Bu iddia doğruysa, klasik yarı iletken geliştirme döngülerine kıyasla son derece agresif bir takvimden söz ediyoruz.

Tam Boyutta Gör Taalas’ın paylaştığı verilere göre HC1, Llama 8B modelini saniyede 14.357 token hızında çalıştırabiliyor ve bazı uzun yanıtları 0,138 saniye gibi sürelerde üretebiliyor. Şirket, bu performansın mevcut en hızlı çıkarım (inference) platformlarından biri olan Cerebras çözümlerinden 10 kat, GPU’lardan ise iki büyüklük mertebesi, yani neredeyse yüz kat daha hızlı olduğunu öne sürüyor.

Verimlilik tarafı da en az performans kadar iddialı. Llama 8B için milyon token başına maliyetin 0,75 cent seviyesinde olduğu belirtiliyor. GPU tarafında benzer iş yükleri için bu maliyet onlarca cente kadar çıkabiliyor. Eğer Taalas tarafından öne sürülen bu rakamlar doğruysa, veri merkezleri için ciddi bir maliyet avantajı anlamına gelebilir.

Diğer yandan enerji tüketimi de önemli bir başlık. Günümüzde bir GPU rack'i (rafı) 120 ila 600 kW arasında güç tüketebilirken, Taalas’ın sistemlerinin 12–15 kW seviyesinde çalıştığı belirtiliyor. Ayrıca hava soğutma ile yetinebilmesi, sıvı soğutma gerektiren mevcut altyapılara kıyasla önemli bir operasyonel avantaj sağlayabilir.

Paylaşılan tüm bu verilerden görebileceğiniz üzere Taalas son derece iddialı geliyor. Ama tabii iddialar bu kadar "inanılmaz" olunca, ister istemez insan daha fazla kanıt görmek istiyor. Bu yüzden Taalas hakkında nihai bir karara varmadan önce bağımsız kaynaklardan gelecek verileri de görmek gerekiyor. Ama Taalas bu vadettiklerinin yarısını bile yapsa sektörde kalıcı bir güç hâline gelebilir.

Taalas'ın Mimarisi Belli Handikaplara da Sahip

Diğer yandan bu yeni mimarinin bariz bir handikapı da var. Esneklik neredeyse yok denecek kadar az. Bildiğiniz gibi veri merkezleri genellikle çok sayıda farklı modeli ve iş yükünü aynı altyapı üzerinde çalıştırıyor. Her model için ayrı bir “Hardcore AI” çipi kullanmak, envanter yönetiminden bakım süreçlerine kadar ciddi bir operasyonel karmaşıklık yaratabilir.

Model güncellemeleri de ayrı bir soru işareti. Büyük dil modelleri genellikle 12–18 ay aralıklarla önemli sürüm güncellemeleri alıyor. Taalas, yalnızca iki metal katmanını değiştirerek çipi iki ay içinde güncelleyebileceğini söylüyor. Bu, tam bir yeniden tasarım yerine kısmi bir revizyon anlamına geliyor. Ancak yine de veri merkezlerinin donanım filolarını bu kadar sık yenilemeye ne kadar sıcak bakacağı belirsiz.

Bununla birlikte; Meta, xAI, OpenAI gibi sektörün ağır topları klasik AI çiplerine şimdiden önemli yatırımlar yapmış durumda. Meta’nın yakın zamanda Nvidia ile çok nesilli bir iş birliği anlaşması yapması, büyük oyuncuların hâlâ genel amaçlı hızlandırıcıları merkezde tuttuğunu gösteriyor. Bu da Taalas’ın yaklaşımının teknik olarak etkileyici olsa bile, pazar tarafından hemen benimsenmeyebileceğine işaret ediyor.

Tüm bu soru işaretlerine rağmen Taalas'ın yaklaşımının gerçekten ilgi çekici olduğu yadsınamaz. Eğer birkaç büyük oyuncu bu mimariyi anlamlı ölçekte benimserse, sektör dengeleri gerçekten değişebilir. Ancak aksi durumda HC1, performans açısından çığır açıcı olsa bile niş bir çözüm olarak kalabilir.

