Компанія Coval, яка спеціалізується на тестуванні та оцінці штучного інтелекту, впроваджує унікальний підхід до оцінювання голосових і текстових агентів зі ШІ. Їх метод натхненний принципами, що використовуються в автомобільній промисловості для тестування безпілотних транспортних засобів.
Повідомляє видання TechCrunch
Як зазначають представники Coval, сьогодні ШІ все активніше інтегрується в повсякденне життя людей — від віртуальних асистентів до автоматизованих служб підтримки клієнтів. Однак виникають питання щодо надійності, ефективності та відповідності очікуванням користувачів. Саме тому Coval запроваджує систему багаторівневого тестування, яка допомагає визначити, наскільки «розумними» є ці рішення в реальних умовах.
Методика Coval передбачає:
- Моделювання складних сценаріїв використання, де ШІ-агенти взаємодіють із користувачами у непередбачуваних ситуаціях.
- Розбиття на рівні безпеки, подібно до систем у самокерованих авто – від повністю автономного режиму до сценаріїв з необхідністю втручання людини.
- Глибокий аналіз продуктивності, з урахуванням факторів, таких як точність відповідей, швидкість реагування та відповідність етичним нормам.
CEO Coval підкреслює, що штучний інтелект має бути не лише розумним, а й безпечним та етичним. Очікується, що результати досліджень Coval допоможуть розробникам штучного інтелекту вдосконалити свої продукти та підвищити їхню якість на глобальному ринку.
Читайте також видання GALERA про проблеми компанії OpenAI з доменом ogopenai.com.