Anlık Bildirim

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?

OpenAI, altı yıl aradan sonra ilk kez açık ağırlıklı bir yapay zeka modelini kullanıma sundu. GPT-OSS adı verilen model ücretsiz olarak indirilebiliyor ve özelleştirilebiliyor.

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı Tam Boyutta Gör
Yapay zeka dünyasında rekabet giderek hız kazanırken OpenAI uzun süredir beklenen bir adımı attı. Şirketin yeni modeli GPT-OSS, hem 120 milyar parametreli hem de 20 milyar parametreli iki farklı sürümle sunuluyor. Bu yeni model, şirketin altı yıl sonra piyasaya sürdüğü ilk açık ağırlıklı model konumunda.

6 yıl sonra gelen GPT-OSS

Ailenin büyük modeli olan gpt-oss-120b tek bir Nvidia GPU üzerinde çalışabiliyor ve şirketin halihazırdaki o4-mini modeliyle benzer performans sergiliyor. Daha küçük model gpt-oss-20b ise yalnızca 16 GB belleğe ihtiyaç duyuyor ve o3-mini seviyesinde bir performans vadediyor. Dolayısıyla her iki model de aslında bir dizüstü bilgisayarda çalıştırılabiliyor.

Her iki model de bugünden itibaren Hugging Face, Databricks, Azure ve AWS gibi platformlar üzerinden indirilebiliyor. Üstelik Apache 2.0 lisansı kapsamında sunulmaları, bu modellerin ticari amaçlarla dahi özgürce değiştirilmesine olanak tanıyor.

OpenAI, ChatGPT öncesinde en son altı yıl önce açık ağırlıklı bir model paylaşmıştı. CEO Sam Altman, uzun süre bu kararın arkasında güvenlik endişelerinin yattığını savunuyordu. Ancak açık kaynaklı modellerin popülaritesinin artması ve DeepSeek gibi alternatiflerin yükselişi şirketin tutumunu yeniden gözden geçirmesine neden oldu. Altman, bu yılın başlarında yaptığı açıklamada, "Tarihin yanlış tarafında yer aldık" diyerek bu konuda geç kaldıklarını kabul etmişti.

Akıl da yürütebiliyor

GPT-OSS, OpenAI’nin yalnızca yazı üretmekle kalmayan, aynı zamanda akıl yürütme, internette tarama, kod yazma ve API aracılığıyla ajan çalıştırma gibi gelişmiş görevleri de yerine getirebilen bir model olarak öne çıkıyor.

Öte yandna OpenAI, GPT-OSS’nin şimdiye kadar en kapsamlı güvenlik testlerinden geçen modeli olduğunu vurguluyor. Siber güvenlik ve biyolojik tehditler gibi hassas konularda harici güvenlik firmalarının da katkısıyla test edilen model karar alma sürecini görünür kılan “zincirleme düşünce” (chain-of-thought) yöntemini de barındırıyor.

OpenAI, açık modellerin eğitiminde kapalı modellerle benzer bir süreç izlediğini belirtiyor. Her iki model de “mixture-of-experts” (MoE) yaklaşımı ile eğitildi. Bu teknik, her token için tüm parametreler yerine yalnızca gerekli olanları aktive ederek verimliliği artırıyor. Ayrıca her iki model, yüksek işlem gücüne sahip takviyeli öğrenme (RL) sürecinden geçirildi.

Performansı nasıl?

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı Tam Boyutta Gör
Bunlarla birlikte GPT-OSS sadece metin tabanlı çıktılar üretebiliyor. Ve diğer OpenAI modellerinde olduğu gibi eğitim verisi kamuya açıklanmıyor. Dolayısıyla model açık ağırlıklı olsa da açık kaynak değil. Ek olarak modelin Llama, DeepSeek veya Google’ın Gemma modelleriyle karşılaştırmalı verileri de henüz paylaşılmadı ve sadece şirketin kenti modelleriyle kıyaslandı.

Yine de OpenAI, GPT-OSS modellerinin açık ağırlıklı modeller arasında lider konuma geldiğini savunuyor. Kodlama platformu Codeforces üzerinde GPT-OSS-120B modeli 2622, GPT-OSS-20B modeli ise 2516 puan alarak DeepSeek’in R1 modelini geride bırakabiliyor. Ancak bu skorlar kapalı o3 ve o4-mini modellerinin gerisinde

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı Tam Boyutta Gör
Bir diğer test olan Humanity’s Last Exam (HLE) sonuçlarında da benzer bir tablo ortaya çıktı. GPT-OSS-120B yüzde 19, GPT-OSS-20B ise yüzde 17,3 başarı oranına ulaştı. Bu da modellerin Qwen ve DeepSeek gibi diğer açık modellerin önüne geçtiğini o3 seviyesinin altında kaldığını gösteriyor.

GPT-OSS modellerinin bir diğer zayıf karnı ise halüsinasyonlar. Modeller, önceki modellere kıyasla daha yüksek oranda yanlış bilgi üretme eğiliminde. Şirketin kendi kıyaslaması olan PersonQA testine göre GPT-OSS-120B modelinin halüsinasyon oranı yüzde 49, 20B modelinin ise yüzde 53. Bu oranlar, o1 modelinin yüzde 16’lık ve o4-mini’nin yüzde 36’lık oranlarının oldukça üzerinde.

Kaynakça https://openai.com/index/introducing-gpt-oss/ https://www.theverge.com/openai/718785/openai-gpt-oss-open-model-release Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin: DH App Gallery Uygulamasını İndir DH Android Uygulamasını İndir DH iOS Uygulamasını İndir
Sorgu:

Editörün Seçtiği Sıcak Fırsatlar

Sıcak Fırsatlar Forumunda Tıklananlar

Tavsiyelerimiz

Yeni Haber
şimdi
Geri Bildirim