
6 yıl sonra gelen GPT-OSS
Ailenin büyük modeli olan gpt-oss-120b tek bir Nvidia GPU üzerinde çalışabiliyor ve şirketin halihazırdaki o4-mini modeliyle benzer performans sergiliyor. Daha küçük model gpt-oss-20b ise yalnızca 16 GB belleğe ihtiyaç duyuyor ve o3-mini seviyesinde bir performans vadediyor. Dolayısıyla her iki model de aslında bir dizüstü bilgisayarda çalıştırılabiliyor.
Her iki model de bugünden itibaren Hugging Face, Databricks, Azure ve AWS gibi platformlar üzerinden indirilebiliyor. Üstelik Apache 2.0 lisansı kapsamında sunulmaları, bu modellerin ticari amaçlarla dahi özgürce değiştirilmesine olanak tanıyor.
OpenAI, ChatGPT öncesinde en son altı yıl önce açık ağırlıklı bir model paylaşmıştı. CEO Sam Altman, uzun süre bu kararın arkasında güvenlik endişelerinin yattığını savunuyordu. Ancak açık kaynaklı modellerin popülaritesinin artması ve DeepSeek gibi alternatiflerin yükselişi şirketin tutumunu yeniden gözden geçirmesine neden oldu. Altman, bu yılın başlarında yaptığı açıklamada, "Tarihin yanlış tarafında yer aldık" diyerek bu konuda geç kaldıklarını kabul etmişti.
Akıl da yürütebiliyor
GPT-OSS, OpenAI’nin yalnızca yazı üretmekle kalmayan, aynı zamanda akıl yürütme, internette tarama, kod yazma ve API aracılığıyla ajan çalıştırma gibi gelişmiş görevleri de yerine getirebilen bir model olarak öne çıkıyor.
Öte yandna OpenAI, GPT-OSS’nin şimdiye kadar en kapsamlı güvenlik testlerinden geçen modeli olduğunu vurguluyor. Siber güvenlik ve biyolojik tehditler gibi hassas konularda harici güvenlik firmalarının da katkısıyla test edilen model karar alma sürecini görünür kılan “zincirleme düşünce” (chain-of-thought) yöntemini de barındırıyor.
OpenAI, açık modellerin eğitiminde kapalı modellerle benzer bir süreç izlediğini belirtiyor. Her iki model de “mixture-of-experts” (MoE) yaklaşımı ile eğitildi. Bu teknik, her token için tüm parametreler yerine yalnızca gerekli olanları aktive ederek verimliliği artırıyor. Ayrıca her iki model, yüksek işlem gücüne sahip takviyeli öğrenme (RL) sürecinden geçirildi.
Performansı nasıl?

Yine de OpenAI, GPT-OSS modellerinin açık ağırlıklı modeller arasında lider konuma geldiğini savunuyor. Kodlama platformu Codeforces üzerinde GPT-OSS-120B modeli 2622, GPT-OSS-20B modeli ise 2516 puan alarak DeepSeek’in R1 modelini geride bırakabiliyor. Ancak bu skorlar kapalı o3 ve o4-mini modellerinin gerisinde

GPT-OSS modellerinin bir diğer zayıf karnı ise halüsinasyonlar. Modeller, önceki modellere kıyasla daha yüksek oranda yanlış bilgi üretme eğiliminde. Şirketin kendi kıyaslaması olan PersonQA testine göre GPT-OSS-120B modelinin halüsinasyon oranı yüzde 49, 20B modelinin ise yüzde 53. Bu oranlar, o1 modelinin yüzde 16’lık ve o4-mini’nin yüzde 36’lık oranlarının oldukça üzerinde.
Kaynakça https://openai.com/index/introducing-gpt-oss/ https://www.theverge.com/openai/718785/openai-gpt-oss-open-model-release Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:


Hala bir BF4 degil su anda. Zamanla duzeltir-gelistirirler diye umuyorum.
Ben şahsen çok beğenmedim hantal bir oyun yapısı var oldum olası bf serisinin Cod da o akıcılık ve hız kesinlikle yok beni bayıyor