Daha gelişmiş ve daha ucuz
Yeni model, karmaşık talimatları daha iyi takip edebiliyor, araç çağırmada hata oranı düşüyor. Aynı zamanda modelin ürettiği seslerin de daha doğal ve ifade dolu olduğu belirtiliyor. OpenAI, modelin sistem mesajlarını ve geliştirici komutlarını eski modellere göre çok daha iyi yorumlayabildiğini belirtiyor.
Realtime API’nin ilk lansmanında 6 ses seçeneği sunulmuş, sonrasında iki yeni ses daha eklenmişti. Şimdi Marin ve Cedar adında iki yeni ses daha duyuruldu. Ek olarak mevcuttaki sekiz ses de daha doğal ve akıcı bir deneyim sunacak şekilde güncellendi.
Yeni model aynı zamanda performans testlerinde de iddialı. Big Bench Audio testinde gpt-realtime yüzde 82,8 doğrulukla, Aralık 2024’teki önceki modelin yüzde 65,6’lık skorunu geride bırakmış durumda. MultiChallenge Audio Benchmark testinde ise model, önceki yüzde 20,6’lık skoru geçerek yüzde 30,5 skor elde etti.
Yeni model ve seslerle birlikte Realtime API’de de güncellemeler yapıldı. Artık API, uzaktan MCP sunucularını, görsel girdileri ve Session Initiation Protocol (SIP) üzerinden telefon aramalarını destekliyor. Ayrıca geliştiriciler kullandıkları talimatları (prompt) kaydedip yeniden kullanabiliyor.
Tüm bu gelişmelere rağmen OpenAI, Realtime API’nin fiyatını düşürdü. gpt-realtime artık, önceki gpt-4o-realtime-preview’a kıyasla yüzde 20 daha ucuz. 1M ses girdi tokeni 32 dolar, 1M ses çıktı tokeni ise 64 dolar seviyesinde.
Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:
Japonlar bunu nasıl kaptırdı yahu?
titanfall gerçek oluyor desenize
Tam teşekküllü işlevsel gerçek Mecha yapmak Japonlara değil de Çinlilere kısmetmiş.