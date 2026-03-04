Teknoloji ve bilim dünyasını seven ve takip etmekten büyük zevk alan Metin, öğrendiklerini ise DonanımHaber okuyucuları ile paylaşır.

ABD’de yapay zeka sektörü sancılı bir dönemden geçerken buna karşın Çin merkezli şirketlerin model geliştirme yarışında hız kesmediği görülüyor. Bu kapsamda Alibaba bünyesindeki Qwen ekibi, yeni Qwen3.5 Small Model Series ailesini duyurdu.

Seri, yalnızca performans iddiasıyla değil, düşük donanım gereksinimiyle de dikkat çekiyor. Öyle ki 2B parametreli sürümün iPhone 17 Pro Max’te yerel olarak çalıştırıldığı, Reddit’te ise 4B versiyonunun cihaz üzerinde çalıştığını gösteren paylaşımların yer aldığı belirtiliyor. Modellerin, boyutunun 4 katı büyüklüğündeki modellere göre daha iyi performans gösterdiğinin altı çiziliyor. Dahası, güçlü amiral gemileriyle sınırlı kalmadan Poco F5 gibi Android cihazlarda da yerel kullanım mümkün görünüyor.

Bu gelişmenin anlamı, yapay zekanın nihayet gerçekten “cihaza inmesi”. Yani buluta bağlı, API anahtarı gerektiren ve kullanım başına ücretlendirme yapan sistemler yerine internet olmadan da çalışabilen, tamamen yerel bir büyük dil modeli doğrudan telefonun içinde görev yapabiliyor.

Dört model, dört farklı kullanım

Serinin 4B modeli ise 262.144 token’lık yerel bağlam penceresiyle hafif ajan uygulamalarına yönelik güçlü çok modlu temel sunuyor. Ailenin en iddialı üyesi olan Qwen3.5-9B, kompakt bir akıl yürütme modeli olarak konumlandırılıyor ve üçüncü taraf testlerde ABD merkezli rakiplerini geride bırakıyor. Şirketin paylaştığı verilere göre 9B modeli, açık kaynaklı gpt-oss-120B modelini birçok kritik kıyaslamada geçmeyi başarıyor. Üstelik bunu yaklaşık 13,5 kat daha küçük parametre ölçeğiyle gerçekleştiriyor.

Qwen3.5 Small serisinin temelinde standart Transformer mimarisinden farklı bir yaklaşım bulunuyor. Alibaba, Gated Delta Networks (doğrusal dikkat mekanizması) ile seyrek Mixture-of-Experts (MoE) yapısını birleştiren verimli bir hibrit mimariye yönelmiş durumda.

Bu mimari, küçük modellerde sıkça karşılaşılan “bellek duvarı” sorununu hafifletmeyi hedefliyor. Böylelikle daha yüksek çıktı hızı ve daha düşük gecikme süresi elde ediliyor. Ayrıca ağın yalnızca gerekli bölümleri aktive edildiği için işlem verimliliği artıyor.

Paylaşılan kıyaslama sonuçları, Qwen3.5 Small serisinin yalnızca “küçük” bir model ailesi olmadığını net biçimde ortaya koyuyor. Özellikle 9B ve 4B sürümleri, çok modlu algılama ve ileri seviye akıl yürütme testlerinde kendi segmentinin çok ötesine geçen bir tablo çiziyor.

Çok modlu görsel akıl yürütme tarafında 9B modeli, hem daha büyük ölçekli alternatifleri hem de hafifletilmiş rakip sürümleri geride bırakmayı başarıyor. Benzer şekilde lisansüstü düzeyde akıl yürütme testlerinde de, parametre sayısı kendisinden katbekat yüksek olan gpt-oss-120B modeline karşı üstünlük kurduğu görülüyor. Video anlama ve altyazı destekli analiz senaryolarında serinin Google’ın hafif model çözümlerinden biri olan Gemini 2.5 Flash-Lite karşısında belirgin bir performans avantajı sağladığı aktarılıyor.

Geliştiriciler, 2B ve 4B modellerini mobil uygulamalar için “oyun değiştirici” olarak nitelendiriyor. Tarayıcı içinde çalıştırılabildiğine dair paylaşımlar da, yüksek işlem gücü gerektiren video analizinin artık uç cihazlarda mümkün olabileceğine işaret ediyor.

Bu arada Qwen3.5 serisinin ağırlıkları ve yapılandırma dosyaları, Apache 2.0 lisansı altında küresel erişime açıldı. Yani ticari kullanım, değiştirme ve yeniden dağıtım hakkı telif ücreti olmadan sunuluyor.

