OpenAI, teknolojik alandaki yeniliklerine bir yenisini daha ekleyerek kullanıcılarla etkileşim kurabilen yeni nesil ses zekası özelliklerini API'sinde tanıttı. Bu gelişme sayesinde geliştiriciler, kullanıcılara sesli yanıt verebilen, konuşmaları metne dönüştürebilen ve anında çeviri yapabilen uygulamalar geliştirebilecekler.
Yeni Ses Modelleri ve Özellikleri
Şirketin tanıttığı en önemli model olan GPT-Realtime-2, kullanıcılarla etkili bir şekilde sohbet edebilmek için tasarlanmış bir ses simülasyonu sunuyor. Önceki versiyonu olan GPT-Realtime-1.5 ile kıyaslandığında, bu yeni model çok daha gelişmiş bir akıl yürütme kapasitesine sahip. OpenAI'ın açıklamalarına göre, bu gelişme kullanıcıların daha karmaşık isteklerine yanıt verebilmek amacıyla gerçekleştirildi.
GPT-Realtime-2'nin performansı, Big Bench Audio testlerinde önemli bir artış göstererek yüzde 15.2 daha yüksek bir skor elde etti. Ayrıca modelin bağlam penceresi 32K'dan 128K'ya çıkarılarak uzun sesli oturumlarda daha verimli çalışması sağlandı. Kullanıcıya süreç hakkında bilgi vermek için aynı anda birden fazla araç çağrısı yapabilmesi de büyük bir avantaj sunuyor.
OpenAI ayrıca GPT-Realtime-Translate isimli yeni bir çeviri özelliği de sundu. Bu özellik, gerçek zamanlı olarak kullanıcının konuşmalarını anlayarak eşzamanlı çeviri yapabiliyor ve çeşitli dillerde destek sağlıyor. Kullanıcılar hem çeviriyi dinleyebiliyor hem de metin çıktısını görebiliyorlar.
Bunların yanı sıra şirket, canlı transkripsiyon yetenekleri sunan GPT-Realtime-Whisper'ı da tanıttı. Bu model özellikle toplantılar ve müşteri destek süreçleri gibi alanlarda kullanılmak üzere düşük gecikmeli transkripsiyon imkanı sağlıyor.
Tüm bu yeni modeller Realtime API ile entegre edilmiş durumda ve OpenAI, bu özelliklerin eğitimden medya sektörüne kadar birçok alanda fayda sağlayacağını vurguluyor.
Sonuç olarak OpenAI'nin yeni ses modelleri, yalnızca teknolojik gelişmeler değil; aynı zamanda çevrimiçi suistimalleri önlemek için de koruma önlemleri içermekte. Şirket zararlı içeriklerin engellenmesi adına özel tetikleyiciler geliştirdiğini duyurdu.