OpenAI’den ileri düzey ses modeli: gpt-realtime özellikleri ve fiyatı

0:00
0:00
OpenAI, en gelişmiş konuşma modelini duyurdu: gpt-realtime. Bu model, karmaşık talimatlarda daha isabetli, araç kullanımında daha az hatalı ve çok daha doğal diyaloglar sunuyor. Model, geliştirici taleplerini anlama konusunda da büyük ilerleme sağladı. Realtime API’ye iki yeni ses –Marin ve Cedar– eklendi; mevcut sesler de daha gerçekçi hale getirildi. Performans testlerinde model önemli fark yarattı: Big Bench Audio’da doğruluk %82,8’e, diğer ölçütlerde ise belirgin puan artışlarına ulaşıldı. API’de uzak sunucu desteği, görüntü işleme, SIP ile telefon entegrasyonu ve isteğe bağlı kayıt/yeniden kullanım gibi yenilikler dikkat çekiyor. Tüm bu artılara rağmen fiyatlar daha rekabetçi: 1 milyon ses giriş belirteci 32, çıkış belirteci 64 dolara sunuluyor; bu da önceki sürüme kıyasla %20 daha ucuz. Böylece OpenAI, ses odaklı uygulama geliştirenler için güçlü ve ekonomik bir seçenek sunuyor.
213