Coval оцінює голосових і чат-ботів з ШІ за аналогією з безпілотними авто

Сергій Красовський23.01.2025

89 1 хвилина читання

Coval оцінка ШІ-моделей — Джерело: ycombinator.com

Компанія Coval, яка спеціалізується на тестуванні та оцінці штучного інтелекту, впроваджує унікальний підхід до оцінювання голосових і текстових агентів зі ШІ. Їх метод натхненний принципами, що використовуються в автомобільній промисловості для тестування безпілотних транспортних засобів.

Повідомляє видання TechCrunch

Як зазначають представники Coval, сьогодні ШІ все активніше інтегрується в повсякденне життя людей — від віртуальних асистентів до автоматизованих служб підтримки клієнтів. Однак виникають питання щодо надійності, ефективності та відповідності очікуванням користувачів. Саме тому Coval запроваджує систему багаторівневого тестування, яка допомагає визначити, наскільки «розумними» є ці рішення в реальних умовах.

Методика Coval передбачає:

Моделювання складних сценаріїв використання, де ШІ-агенти взаємодіють із користувачами у непередбачуваних ситуаціях.
Розбиття на рівні безпеки, подібно до систем у самокерованих авто – від повністю автономного режиму до сценаріїв з необхідністю втручання людини.
Глибокий аналіз продуктивності, з урахуванням факторів, таких як точність відповідей, швидкість реагування та відповідність етичним нормам.

CEO Coval підкреслює, що штучний інтелект має бути не лише розумним, а й безпечним та етичним. Очікується, що результати досліджень Coval допоможуть розробникам штучного інтелекту вдосконалити свої продукти та підвищити їхню якість на глобальному ринку.

Читайте також видання GALERA про проблеми компанії OpenAI з доменом ogopenai.com.

Позначки

Сергій Красовський23.01.2025

89 1 хвилина читання

Coval оцінює голосових і чат-ботів з ШІ за аналогією з безпілотними авто

Anthropic може вимагати паспорт для доступу до Claude

Вразливість у старих iPhone: відкриває шлях до джейлбрейку

10 найбільших IT-аутсорсерів України збільшили свій виторг за першу половину 2026 року

Українець створив рейтинг коментаторських перлів з Чемпіонату світу з футболу 2026

Як штучний інтелект трансформує український бізнес у 2026 році

Мінцифри спрощує правила для вітчизняного ринку хмарних послуг

Лауреат Нобелівської премії Джон Джампер залишає Google DeepMind заради Anthropic

Колишні співробітники OpenAI запустили сервіс, який показує, наскільки добре вас «пам’ятає» штучний інтелект

Після блокування Telegram в Індії користувачі масово почали завантажувати VPN-сервіси

Apple представила нові функції iOS 27: ШІ для повсякденних завдань, оновлений Wallet та покращений Maps

Google відновив вручення нагород українським авторам YouTube-каналів

Оновлена платна послуга Meta без реклами може порушувати закони ЄС