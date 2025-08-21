Teknoloji ve bilim dünyasını seven ve takip etmekten büyük zevk alan Metin, öğrendiklerini ise DonanımHaber okuyucuları ile paylaşır.

Tam Boyutta Gör Çin merkezli yapay zeka girişimi DeepSeek, 685 milyar parametreye sahip yeni modeli DeepSeek V3.1’i sessiz sedasız yayınladı. Şirket, High-Flyer Capital Management desteğiyle geliştirdiği modeli, büyük bir lansman yapmadan Hugging Face platformuna yükledi. Bu sakin yaklaşım, modelin potansiyel etkisini küçültse de, kısa sürede yapılan performans testleri OpenAI ve Anthropic’in en ileri sistemleriyle yarışabilecek seviyede olduğunu gösterdi. Üstelik açık kaynak lisansı sayesinde model, coğrafi veya politik sınırlamalardan bağımsız olarak dünya genelinde erişilebilir durumda.

Modelin piyasaya sürülmesi, sadece bir performans güncellemesi değil, aynı zamanda yapay zekanın geliştirilmesi, dağıtılması ve kontrol edilmesi yöntemlerinde köklü bir değişimin işareti olarak değerlendiriliyor. Dolayısıyla ABD-Çin arasındaki teknoloji rekabeti açısından da önemli yansımalar taşıyor.

Performans, teknik yenilikler ve maliyet avantajı

Tam Boyutta Gör DeepSeek V3.1, yüzde 71,6 Aider kodlama benchmark skoru ile doğrudan Amerikan rakiplerine meydan okuyor. Model, yaklaşık 400 sayfalık bir kitabın eşdeğeri olan 128.000 token’a kadar bağlam işleyebiliyor ve yanıt süreleri önceki düşünen modelleri geride bırakıyor.

BF16’den deneysel FP8’e kadar çoklu hassasiyet formatlarını destekleyen sistem, geliştiricilerin donanımına göre optimize edilebiliyor. Şirket, bu sürümün Çin yapımı çiplere optimize edilebilen bir özelliğe sahip olduğunu ve daha hızlı işlem performansı sunduğunu açıkladı.

Tam Boyutta Gör Asıl yenilik ise DeepSeek’in “hibrit mimari” olarak adlandırdığı yaklaşımda gizli. V3.1, sohbet, mantıksal çıkarım ve kodlama fonksiyonlarını tek bir modelde birleştirerek tutarlı ve yüksek performanslı bir sistem sunuyor. AI araştırmacısı Andrew Christianson’a göre DeepSeek V3.1, Claude Opus 4’ten yüzde 1 daha yüksek performans sağlıyor ve maliyeti 68 kat düşürüyor.

V3.1’in mimarisinde gerçek zamanlı web entegrasyonu sağlayan arama tokenları ve içsel mantıksal çıkarım için düşünme tokenları da bulunuyor. Bu özellikler, daha önce hibrit sistemlerde yaşanan temel sorunların aşılmış olduğunu gösteriyor.

Tam Boyutta Gör Modelin verimliliği de aynı derecede etkileyici. Tam bir kodlama görevi için yaklaşık 1,01 dolar maliyetle DeepSeek V3.1, eşdeğer iş yükü için yaklaşık 70 dolar maliyetli sistemlerle karşılaştırılabilir sonuçlar sunuyor. Günlük binlerce AI etkileşimini yöneten kurumsal kullanıcılar için bu maliyet farkları, milyonlarca dolarlık potansiyel tasarruf anlamına geliyor.

DeepSeek, açık kaynak erişimini koruyarak ABD merkezli şirketlerin iş modellerine doğrudan meydan okuyor. ABD’li firmalar modellerini yüksek lisans ücretleri ve kullanım kısıtlamalarıyla korurken DeepSeek benzer kapasitelere herkese ücretsiz erişim imkanı sunuyor.

