OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı

Metin Akpınar

Teknoloji Editörü

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı — Yapay zeka dünyasında rekabet giderek hız kazanırken OpenAI uzun süredir beklenen bir adımı attı. Şirketin yeni modeli GPT-OSS, hem 120 milyar parametreli hem de 20 milyar parametreli iki farklı sürümle sunuluyor. Bu yeni model, şirketin altı yıl sonra piyasaya sürdüğü ilk açık ağırlıklı model konumunda.

6 yıl sonra gelen GPT-OSS

Ailenin büyük modeli olan gpt-oss-120b tek bir Nvidia GPU üzerinde çalışabiliyor ve şirketin halihazırdaki o4-mini modeliyle benzer performans sergiliyor. Daha küçük model gpt-oss-20b ise yalnızca 16 GB belleğe ihtiyaç duyuyor ve o3-mini seviyesinde bir performans vadediyor. Dolayısıyla her iki model de aslında bir dizüstü bilgisayarda çalıştırılabiliyor.

Her iki model de bugünden itibaren Hugging Face, Databricks, Azure ve AWS gibi platformlar üzerinden indirilebiliyor. Üstelik Apache 2.0 lisansı kapsamında sunulmaları, bu modellerin ticari amaçlarla dahi özgürce değiştirilmesine olanak tanıyor.

OpenAI, ChatGPT öncesinde en son altı yıl önce açık ağırlıklı bir model paylaşmıştı. CEO Sam Altman, uzun süre bu kararın arkasında güvenlik endişelerinin yattığını savunuyordu. Ancak açık kaynaklı modellerin popülaritesinin artması ve DeepSeek gibi alternatiflerin yükselişi şirketin tutumunu yeniden gözden geçirmesine neden oldu. Altman, bu yılın başlarında yaptığı açıklamada, "Tarihin yanlış tarafında yer aldık" diyerek bu konuda geç kaldıklarını kabul etmişti.

Akıl da yürütebiliyor

GPT-OSS, OpenAI’nin yalnızca yazı üretmekle kalmayan, aynı zamanda akıl yürütme, internette tarama, kod yazma ve API aracılığıyla ajan çalıştırma gibi gelişmiş görevleri de yerine getirebilen bir model olarak öne çıkıyor.

Öte yandna OpenAI, GPT-OSS’nin şimdiye kadar en kapsamlı güvenlik testlerinden geçen modeli olduğunu vurguluyor. Siber güvenlik ve biyolojik tehditler gibi hassas konularda harici güvenlik firmalarının da katkısıyla test edilen model karar alma sürecini görünür kılan “zincirleme düşünce” (chain-of-thought) yöntemini de barındırıyor.

OpenAI, açık modellerin eğitiminde kapalı modellerle benzer bir süreç izlediğini belirtiyor. Her iki model de “mixture-of-experts” (MoE) yaklaşımı ile eğitildi. Bu teknik, her token için tüm parametreler yerine yalnızca gerekli olanları aktive ederek verimliliği artırıyor. Ayrıca her iki model, yüksek işlem gücüne sahip takviyeli öğrenme (RL) sürecinden geçirildi.

Performansı nasıl?

Yine de OpenAI, GPT-OSS modellerinin açık ağırlıklı modeller arasında lider konuma geldiğini savunuyor. Kodlama platformu Codeforces üzerinde GPT-OSS-120B modeli 2622, GPT-OSS-20B modeli ise 2516 puan alarak DeepSeek’in R1 modelini geride bırakabiliyor. Ancak bu skorlar kapalı o3 ve o4-mini modellerinin gerisinde

GPT-OSS modellerinin bir diğer zayıf karnı ise halüsinasyonlar. Modeller, önceki modellere kıyasla daha yüksek oranda yanlış bilgi üretme eğiliminde. Şirketin kendi kıyaslaması olan PersonQA testine göre GPT-OSS-120B modelinin halüsinasyon oranı yüzde 49, 20B modelinin ise yüzde 53. Bu oranlar, o1 modelinin yüzde 16’lık ve o4-mini’nin yüzde 36’lık oranlarının oldukça üzerinde.

Kaynakça https://openai.com/index/introducing-gpt-oss/ https://www.theverge.com/openai/718785/openai-gpt-oss-open-model-release