НовиниСвіт

OpenAI запускає нові голосові AI-функції для розмов, перекладу та транскрипції

Компанія OpenAI представила нові голосові AI-можливості для свого API, які дозволяють створювати застосунки з живими розмовами, перекладом і транскрипцією в реальному часі.

Повідомляє видання GALERANEWS, посилаючись на TechCrunch.

Серед головних новинок — модель GPT-Realtime-2, яка забезпечує більш природне голосове спілкування та використовує логіку рівня GPT-5 для складніших діалогів.

Також компанія представила GPT-Realtime-Translate — систему перекладу в реальному часі, що підтримує понад 70 мов для розпізнавання та 13 мов для озвучення.

Ще одним оновленням став GPT-Realtime-Whisper — інструмент для миттєвої транскрипції мовлення у текст.

В OpenAI зазначають, що нові моделі дозволяють AI не лише відповідати, а й аналізувати розмову, перекладати, розпізнавати мову та виконувати дії під час діалогу.

Компанія очікує, що ці інструменти активно використовуватимуться у службах підтримки, освіті, медіа та creator-платформах.

Водночас OpenAI заявила про вбудовані механізми захисту від шахрайства, спаму та зловживань із використанням голосових AI-технологій. Усі нові функції вже доступні через Realtime API OpenAI.

Back to top button