Компанія OpenAI представила нові голосові AI-можливості для свого API, які дозволяють створювати застосунки з живими розмовами, перекладом і транскрипцією в реальному часі.
Повідомляє видання GALERANEWS, посилаючись на TechCrunch.
Серед головних новинок — модель GPT-Realtime-2, яка забезпечує більш природне голосове спілкування та використовує логіку рівня GPT-5 для складніших діалогів.
Також компанія представила GPT-Realtime-Translate — систему перекладу в реальному часі, що підтримує понад 70 мов для розпізнавання та 13 мов для озвучення.
Ще одним оновленням став GPT-Realtime-Whisper — інструмент для миттєвої транскрипції мовлення у текст.
В OpenAI зазначають, що нові моделі дозволяють AI не лише відповідати, а й аналізувати розмову, перекладати, розпізнавати мову та виконувати дії під час діалогу.
Компанія очікує, що ці інструменти активно використовуватимуться у службах підтримки, освіті, медіа та creator-платформах.
Водночас OpenAI заявила про вбудовані механізми захисту від шахрайства, спаму та зловживань із використанням голосових AI-технологій. Усі нові функції вже доступні через Realtime API OpenAI.