НовиниСвіт

ШІ тестують за допомогою Super Mario: новий підхід до оцінки штучного інтелекту

Дослідники з лабораторії Hao AI при Каліфорнійському університеті запропонували новий спосіб оцінки можливостей штучного інтелекту. Вони використовують класичну відеогру Super Mario Bros як тестовий майданчик. За допомогою гри проводиться перевірка того, наскільки алгоритми здатні адаптуватися до динамічних середовищ, приймати рішення в реальному часі та вчитися на власних помилках.

Повідомляє видання News Bytes

Дослідники застосували емулятор GamingAgent, який дозволяє штучному інтелекту керувати персонажем у грі. Процес виглядає наступним чином:

  • ШІ отримує знімки екрану гри та базові інструкції
  • Використовуючи Python-код, генерує дії для управління персонажем
  • Аналізується здатність ШІ ефективно рухатися, ухилятися від ворогів та знаходити оптимальні маршрути проходження рівнів

У випробуваннях взяли участь кілька сучасних моделей штучного інтелекту. Найкращі результати продемонстрували Claude 3.7 та Claude 3.5, які змогли адаптуватися до змін у грі та виявили ефективне стратегічне мислення. Натомість GPT-4o та Gemini 1.5 Pro зіткнулися з труднощами через затримки у прийнятті рішень, що значно впливало на їх ефективність у грі.

Швидкість реакції та адаптивність є ключовими факторами успішності ШІ у динамічних середовищах. Тестування на основі відеоігор допомагає перевірити, наскільки алгоритми здатні навчатися та передбачати розвиток подій. Це відкриває можливості для розробки більш ефективних систем штучного інтелекту для реальних застосувань, таких як автономні автомобілі, роботизовані помічники та фінансові аналітичні алгоритми.

Дослідники планують застосовувати аналогічні методи тестування в інших відеоіграх, включно з більш складними 3D-середовищами. Це допоможе оцінити здатність штучного інтелекту пристосовуватися до складніших і менш передбачуваних сценаріїв.

Нагадаємо, видання GALERA також повідомляло про модель штучного інтелекту GPT-4.5 від OpenAI.

Back to top button