İnsanlar anında öğreniyor, modeller hatırlamaya çalışıyor
Araştırmacılar, gelecekte yapay zeka modellerinin kontrollü ortamların dışına çıkabilmesi için “bağlam öğrenmenin” model tasarımının merkezine yerleştirilmesi gerektiğini savunuyor. Araştırmacılara göre mevcut sistemler, gerekli bilgilere erişebilmelerine rağmen bağlamı doğru şekilde yorumlayamadıkları için görevleri tutarlı biçimde yerine getiremiyor.
Tencent’e göre insanlar bu süreçlerde geçmişte ezberlenmiş sabit bilgiye değil, o anda karşılarına çıkan bağlama dayanarak öğreniyor. Buna karşın mevcut büyük dil modelleri, ağırlıklı olarak ön eğitim sırasında parametrelerine gömülmüş bilgiyi geri çağırıyor. Çıkarım aşamasında ise yeni bilgiyi aktif biçimde öğrenmek yerine, statik iç belleğine yaslanıyor.
Araştırmada bu durum, “yapısal bir uyumsuzluk” olarak tanımlanıyor. Modeller, bildikleri şeyler üzerinden akıl yürütmek için optimize edilmiş durumda. Oysa kullanıcılar, sürekli değişen ve dağınık bağlamlara bağlı problemleri çözebilen sistemlere ihtiyaç duyuyor.
Bağlam öğrenmeyi ölçmek için yeni standart geliştirildi
CL-bench, klasik bilgi sorularına dayanan kıyaslamalardan farklı olarak her görevin kendi bağlamını modele sunuyor. Bu yaklaşım temelde insanların öğrenme biçimine daha yakın. Ek olarak bunu sürekli öğrenme modelleriyle de karıştırmamak gerek. Birisinde model, kendi ağırlıklarını sürekli güncellerken bağlan öğrenmede temel parametreler değişmeden kalıyor.
Ortalama başarı yüzde 17
Öte yandan en yüksek puanı yüzde 23,7 ile OpenAI’ın GPT-5.1 modeli alırken, onu yüzde 21,1 ile Anthropic’in Claude Opus 4.5 modeli izledi. Çin merkezli modeller arasında en iyi performans, Moonshot AI’ın Kimi K2 modeliyle beşinci sırada ve yüzde 17,6 seviyesinde gerçekleşti. Tencent’in kendi modeli Hunyuan 2.0, yüzde 17,2 skorla altıncı sırada yer aldı.
Ancak yukarıda saydıklarımız “iyi” istatistikler. En başarılı olan GPT-5.1 modeli bile hiçbir bağlam verilmediğinde görevlerin yüzde 1’inden daha azını çözebildi.
Araştırma, bağlam öğrenmenin gelişmesi halinde insan-yapay zeka ilişkisinin de değişeceğini öngörüyor. Buna göre insanlar, modele veri sağlayan aktörler olmaktan çıkıp, en doğru ve zengin bağlamı tasarlayan “bağlam sağlayıcılara” dönüşebilir.
Ancak burada kritik bir sorun var. Tencent’e göre bağlam öğrenme geçici bir süreç. Model, bağlam penceresi kapandığında öğrendiklerini unutuyor. Asıl büyük soru ise şu: Bağlamdan edinilen bilgi nasıl kalıcı hale getirilebilir? Bu yalnızca olguları değil, becerileri, deneyimi ve kalıpları da kapsayan daha derin bir öğrenme anlamına geliyor.
Bu arada CL-Bench’e GitHub veya Hugging Face ulaşabilirsiniz.
Kaynakça https://www.techinasia.com/news/tencent-ai-models-still-struggle-in-real-world-settings https://hunyuan.tencent.com/research/100025?langVersion=en https://www.scmp.com/tech/big-tech/article/3342386/when-context-everything-ai-models-still-struggle-real-world-tencent https://arxiv.org/abs/2602.03587 Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:
ahaha buddadroid
Niye herşeyi yapay zekaya soruyorsun o zaman.
dinimizi robotlardan öğrenecek değiliz
tüm sistemini hırsızlık üzerine kurmuş bir ülkeden bahsediyoruz, şaşırmadım