Devlere kafa tutuyor
Qwen3 ailesi, parametre sayısı 600 milyondan 235 milyara kadar değişen çok sayıda modelden oluşuyor. Parametre sayısı, bir yapay zeka modelinin problem çözme yeteneğini doğrudan etkileyen önemli bir metrik olarak kabul ediliyor. Alibaba’nın açıklamasına göre, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini belirli kıyaslamalarda geride bırakmayı başardı. Qwen3 modellerinin hiçbiri OpenAI'nin o3 ve o4-mini gibi en üst düzey yeni modellerden daha üstün görünmüyor, ancak yine de güçlü performans sergiliyorlar.
Ancak bu en güçlü model henüz kamuya açık değil. Bunun yerine Qwen3-32B gibi daha küçük ama yine de etkileyici performans sergileyen modeller Hugging Face ve GitHub üzerinden indirilebiliyor. Qwen3 modelleri ayrıca Fireworks AI ve Hyperbolic gibi bulut servis sağlayıcılar üzerinden de erişime açık durumda.
Hibrit yaklaşımı benimsiyor
Buna ek olarak bazı Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts - MoE) mimarisiyle çalışıyor. Bu yöntem, işlemleri alt görevlere ayırarak uzman alt modellerin her birine dağıtıyor; böylece karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerliyor.
119 dil ve 36 trilyon token
Alibaba, Qwen3’ün 119 dili desteklediğini ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham veri bitleridir; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş veri kümeleri yer alıyor. Bu geniş veri tabanı sayesinde Qwen3, yalnızca genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü sonuçlar veriyor. Örneğin LiveCodeBench gibi yazılım kıyaslamalarında OpenAI’ın o1 modelinin önüne geçmeyi başarıyor. Alibaba, Qwen3'ün araç çağırma yeteneklerinin yanı sıra talimatları takip etme ve belirli veri formatlarını kopyalama konusunda da “üstün” olduğunu söylüyor.
(Güncellendi: )
Haberi DH'de Gör
{{body}}
{{/longBody}} {{^longBody}}{{body}}
{{/longBody}}