Çinli DeepSeek, 685 milyar parametreli V3.1 modeliyle Amerikan AI devlerine meydan okuyor. Açık kaynak, yüksek performans ve düşük maliyet avantajıyla küresel yapay zeka rekabetini kızıştırıyor.
Tam Boyutta GörÇin merkezli yapay zeka girişimi DeepSeek, 685 milyar parametreye sahip yeni modeli DeepSeek V3.1’i sessiz sedasız yayınladı. Şirket, High-Flyer Capital Management desteğiyle geliştirdiği modeli, büyük bir lansman yapmadan Hugging Face platformuna yükledi. Bu sakin yaklaşım, modelin potansiyel etkisini küçültse de, kısa sürede yapılan performans testleri OpenAI ve Anthropic’in en ileri sistemleriyle yarışabilecek seviyede olduğunu gösterdi. Üstelik açık kaynak lisansı sayesinde model, coğrafi veya politik sınırlamalardan bağımsız olarak dünya genelinde erişilebilir durumda.
Modelin piyasaya sürülmesi, sadece bir performans güncellemesi değil, aynı zamanda yapay zekanın geliştirilmesi, dağıtılması ve kontrol edilmesi yöntemlerinde köklü bir değişimin işareti olarak değerlendiriliyor. Dolayısıyla ABD-Çin arasındaki teknoloji rekabeti açısından da önemli yansımalar taşıyor.
Performans, teknik yenilikler ve maliyet avantajı
Tam Boyutta GörDeepSeek V3.1, yüzde 71,6 Aider kodlama benchmark skoru ile doğrudan Amerikan rakiplerine meydan okuyor. Model, yaklaşık 400 sayfalık bir kitabın eşdeğeri olan 128.000 token’a kadar bağlam işleyebiliyor ve yanıt süreleri önceki düşünen modelleri geride bırakıyor.
BF16’den deneysel FP8’e kadar çoklu hassasiyet formatlarını destekleyen sistem, geliştiricilerin donanımına göre optimize edilebiliyor. Şirket, bu sürümün Çin yapımı çiplere optimize edilebilen bir özelliğe sahip olduğunu ve daha hızlı işlem performansı sunduğunu açıkladı.
Tam Boyutta GörAsıl yenilik ise DeepSeek’in “hibrit mimari” olarak adlandırdığı yaklaşımda gizli. V3.1, sohbet, mantıksal çıkarım ve kodlama fonksiyonlarını tek bir modelde birleştirerek tutarlı ve yüksek performanslı bir sistem sunuyor. AI araştırmacısı Andrew Christianson’a göre DeepSeek V3.1, Claude Opus 4’ten yüzde 1 daha yüksek performans sağlıyor ve maliyeti 68 kat düşürüyor.
V3.1’in mimarisinde gerçek zamanlı web entegrasyonu sağlayan arama tokenları ve içsel mantıksal çıkarım için düşünme tokenları da bulunuyor. Bu özellikler, daha önce hibrit sistemlerde yaşanan temel sorunların aşılmış olduğunu gösteriyor.
Tam Boyutta GörModelin verimliliği de aynı derecede etkileyici. Tam bir kodlama görevi için yaklaşık 1,01 dolar maliyetle DeepSeek V3.1, eşdeğer iş yükü için yaklaşık 70 dolar maliyetli sistemlerle karşılaştırılabilir sonuçlar sunuyor. Günlük binlerce AI etkileşimini yöneten kurumsal kullanıcılar için bu maliyet farkları, milyonlarca dolarlık potansiyel tasarruf anlamına geliyor.
DeepSeek, açık kaynak erişimini koruyarak ABD merkezli şirketlerin iş modellerine doğrudan meydan okuyor. ABD’li firmalar modellerini yüksek lisans ücretleri ve kullanım kısıtlamalarıyla korurken DeepSeek benzer kapasitelere herkese ücretsiz erişim imkanı sunuyor.
Ana akım medyada doğa dostu haberler izlemek istiyoruz.