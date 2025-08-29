Teknoloji ve bilim dünyasını seven ve takip etmekten büyük zevk alan Metin, öğrendiklerini ise DonanımHaber okuyucuları ile paylaşır.

Tam Boyutta Gör OpenAI, geliştiricilere düşük gecikmeli ve çok modlu deneyimler sunma imkanı sağlayan Realtime API’yi Ekim 2024’te tanıtmıştı. O tarihten bu yana binlerce geliştirici, bu API sayesinde uygulamalarında doğal dilde konuşma deneyimleri oluşturdu. Şimdi ise daha gelişmiş özellikler barındırılan gpt-realtime adlı konuşma modelin duyuruldu.

Daha gelişmiş ve daha ucuz

Yeni model, karmaşık talimatları daha iyi takip edebiliyor, araç çağırmada hata oranı düşüyor. Aynı zamanda modelin ürettiği seslerin de daha doğal ve ifade dolu olduğu belirtiliyor. OpenAI, modelin sistem mesajlarını ve geliştirici komutlarını eski modellere göre çok daha iyi yorumlayabildiğini belirtiyor.

Realtime API’nin ilk lansmanında 6 ses seçeneği sunulmuş, sonrasında iki yeni ses daha eklenmişti. Şimdi Marin ve Cedar adında iki yeni ses daha duyuruldu. Ek olarak mevcuttaki sekiz ses de daha doğal ve akıcı bir deneyim sunacak şekilde güncellendi.

Yeni model aynı zamanda performans testlerinde de iddialı. Big Bench Audio testinde gpt-realtime yüzde 82,8 doğrulukla, Aralık 2024’teki önceki modelin yüzde 65,6’lık skorunu geride bırakmış durumda. MultiChallenge Audio Benchmark testinde ise model, önceki yüzde 20,6’lık skoru geçerek yüzde 30,5 skor elde etti.

Yeni model ve seslerle birlikte Realtime API’de de güncellemeler yapıldı. Artık API, uzaktan MCP sunucularını, görsel girdileri ve Session Initiation Protocol (SIP) üzerinden telefon aramalarını destekliyor. Ayrıca geliştiriciler kullandıkları talimatları (prompt) kaydedip yeniden kullanabiliyor.

Tüm bu gelişmelere rağmen OpenAI, Realtime API’nin fiyatını düşürdü. gpt-realtime artık, önceki gpt-4o-realtime-preview’a kıyasla yüzde 20 daha ucuz. 1M ses girdi tokeni 32 dolar, 1M ses çıktı tokeni ise 64 dolar seviyesinde.

