GPT-5.3 Instant güncellemesi: Ret oranı ve halüsinasyon metriklerinde dikkat çeken düşüş
GPT-5.3 Instant güncellemesinin en belirgin başlıklarından biri, modelin ret değerlendirme mekanizmasındaki iyileştirmeler. Önceki sürüm GPT-5.2 Instant’ın bazı durumlarda güvenli şekilde yanıtlanabilecek soruları gereksiz yere reddettiğine ve özellikle hassas konularda aşırı temkinli ya da öğretici bir ton benimsediğine dair geri bildirimler alındığı belirtiliyor. Yeni sürüm, bu gereksiz reddetmeleri önemli ölçüde azaltırken, yanıt öncesinde kullanılan savunmacı veya ahlaki çerçeveleyici ifadeleri de hafifletiyor.
Web kullanımında da dikkat çekici bir optimizasyon söz konusu. GPT-5.3 Instant, çevrim içi kaynaklardan gelen bilgileri yalnızca özetlemek yerine, kendi bilgi birikimi ve akıl yürütme kapasitesiyle sentezleyerek daha bütüncül değerlendirmeler sunuyor. Önceki sürümlerde zaman zaman görülebilen uzun bağlantı listeleri veya zayıf ilişkili içeriklerin öne çıkması eğilimi azaltılmış durumda. Model, sorunun alt bağlamını analiz ederek en kritik bilgiyi yanıtın başında önceliklendirmeye çalışıyor.
Doğruluk tarafında ise şirket iki ayrı iç değerlendirme metodolojisi kullandığını aktarıyor. Tıp, hukuk ve finans gibi yüksek riskli alanlara odaklanan testlerde GPT-5.3 Instant, web kullanıldığında halüsinasyon oranını yüzde 26,8; yalnızca dahili bilgiye dayanıldığında ise yüzde 19,7 oranında azaltmış durumda. Kullanıcıların olgusal hata olarak işaretlediği, kimlikten arındırılmış konuşmalar üzerinden yapılan ikinci değerlendirmede ise halüsinasyon oranları web kullanımıyla yüzde 22,5, web erişimi olmadan yüzde 9,6 düşüş göstermiş.
Güncelleme yalnızca teknik metriklerle sınırlı değil; konuşma tarzı ve dil akışı da yeniden ele alınmış. GPT-5.2 Instant’ın zaman zaman kullanıcı niyeti hakkında gereksiz varsayımlarda bulunan veya yapay müdahaleler içeren bir ton sergileyebildiği ifade ediliyor. GPT-5.3 Instant ile birlikte bu tür ifadelerin azaltıldığı ve daha dengeli, doğal bir iletişim tarzının benimsendiği belirtiliyor.
Yazım ve içerik üretimi tarafında da modelin daha geniş bir ifade aralığı sunduğu vurgulanıyor. Kurgu üretimi, metin geliştirme veya fikir keşfi gibi yaratıcı görevlerde daha sürükleyici ve tutarlı çıktılar hedefleniyor. Bu, pratik görevlerle yaratıcı üretim arasında daha akıcı geçiş yapabilen bir sistem tasarımına işaret ediyor. Özellikle profesyonel yazım süreçlerinde, hem teknik doğruluğu hem de anlatı gücünü dengeleyebilen modellerin önemi düşünüldüğünde, bu iyileştirme rekabet açısından kritik bir alan olarak öne çıkıyor.
Bununla birlikte bazı sınırlamalar da devam ediyor. İngilizce dışındaki dillerde, özellikle Japonca ve Korece gibi dillerde yanıtların zaman zaman yapay veya kelimesi kelimesine çevrilmiş gibi hissedilebildiği belirtiliyor. Çok dilli ton tutarlılığı ve doğal ifade, geliştirme öncelikleri arasında yer alıyor. Ayrıca yanıt tonunun daha akıcı hale getirilmiş olmasına rağmen, kullanıcı geri bildirimlerinin izlenmeye devam edeceği ve özelleştirme seçeneklerinin genişletileceği ifade ediliyor.
Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:
Türkiyede gelmez malsesef gelse bile 1,2m den aşağı sattırmazlar. Bize ucuz araba haram çünkü [resim]
Hafif araç çitlenbik gibi, ne yalan söyleyeyim araç çok hoşuma gitti, şehir içinde ideal bir araç
bence pastadan ciddi bir pay alabilir
hiç fena değil
evin 2. arabası olur