Uygulama ile Aç

Alibaba, hibrit yapay zeka modeli ailesi Qwen3 ile yarışa dahil oldu

Çinli teknoloji şirketi Alibaba, Google ve OpenAI’ın en iyi modelleriyle rekabet edebileceğini ve hatta onları geçebileceğini söyledi hibrit yapay zeka modeli ailesi Qwen3'ü tanıttı.

Çin’in teknoloji devi Alibaba, yapay zeka alanında ses getiren yeni modeli Qwen3’ü tanıttı. Şirketin "hibrit" yapıda tanımladığı bu yeni yapay zeka ailesi, hem Amerika merkezli dev rakipler OpenAI ve Google’ın modellerine kafa tutuyor hem de açık kaynak yaklaşımıyla dikkat çekiyor.

Devlere kafa tutuyor

Qwen3 ailesi, parametre sayısı 600 milyondan 235 milyara kadar değişen çok sayıda modelden oluşuyor. Parametre sayısı, bir yapay zeka modelinin problem çözme yeteneğini doğrudan etkileyen önemli bir metrik olarak kabul ediliyor. Alibaba’nın açıklamasına göre, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini belirli kıyaslamalarda geride bırakmayı başardı. Qwen3 modellerinin hiçbiri OpenAI'nin o3 ve o4-mini gibi en üst düzey yeni modellerden daha üstün görünmüyor, ancak yine de güçlü performans sergiliyorlar.

Ayrıca bkz.

ChatGPT artık alışveriş için ürün tavsiyeleri de gösteriyor

Ancak bu en güçlü model henüz kamuya açık değil. Bunun yerine Qwen3-32B gibi daha küçük ama yine de etkileyici performans sergileyen modeller Hugging Face ve GitHub üzerinden indirilebiliyor. Qwen3 modelleri ayrıca Fireworks AI ve Hyperbolic gibi bulut servis sağlayıcılar üzerinden de erişime açık durumda.

Hibrit yaklaşımı benimsiyor

Qwen3 modellerinin en dikkat çekici özelliklerinden biri “hibrit” yapısı. Bu yapı, modelin karmaşık sorunlar karşısında düşünme süreci uygulamasına, basit sorulara ise hızlı cevap vermesine olanak tanıyor; kısaca model, gerektiğinde düşünüyor. Kullanıcılar, modelin ne kadar "düşüneceğine" karar verebiliyor. Alibaba mühendisleri bu esnekliği "düşünme bütçesinin kontrolü" olarak tanımlıyor. Bu tip çözümleri yakın geçmişte görmeye başladı.

Buna ek olarak bazı Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts - MoE) mimarisiyle çalışıyor. Bu yöntem, işlemleri alt görevlere ayırarak uzman alt modellerin her birine dağıtıyor; böylece karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerliyor.

119 dil ve 36 trilyon token

Alibaba, Qwen3’ün 119 dili desteklediğini ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham veri bitleridir; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş veri kümeleri yer alıyor. Bu geniş veri tabanı sayesinde Qwen3, yalnızca genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü sonuçlar veriyor. Örneğin LiveCodeBench gibi yazılım kıyaslamalarında OpenAI’ın o1 modelinin önüne geçmeyi başarıyor. Alibaba, Qwen3'ün araç çağırma yeteneklerinin yanı sıra talimatları takip etme ve belirli veri formatlarını kopyalama konusunda da “üstün” olduğunu söylüyor.

(Güncellendi: )



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş

Beğenilen Yorumlar

Tümünü Gör
1 Yorumun Tamamını Gör