Попри стрімкий розвиток технологій штучного інтелекту та зростаючі побоювання щодо витіснення людей з ринку праці, нове дослідження, про яке повідомляє видання ZDNet, демонструє суттєві обмеження сучасних AI-агентів у виконанні реальних віддалених фріланс-завдань. Результати вказують на те, що на сьогодні штучний інтелект не здатний ефективно замінити людських фахівців у більшості складних професійних робочих процесів.
Мета та методологія дослідження
Дослідження було спрямоване на перевірку того, наскільки сучасні AI-системи можуть виконувати реальні оплачувані завдання, аналогічні тим, які щоденно виконують фрілансери на платформах дистанційної роботи. Для цього дослідники розробили спеціальний показник — Remote Labor Index (RLI).
RLI охоплює набір практичних проєктів із ринку фрілансу, зокрема завдання у сферах:
- веб- та програмної розробки,
- графічного дизайну,
- анімації,
- аналізу даних,
- створення контенту.
AI-агентам надавали ті самі технічні завдання, вихідні матеріали та вимоги, що й людським виконавцям. Ключовим критерієм оцінки була не формальна правильність відповіді, а придатність результату до реального використання клієнтом.
Основні результати
Результати тестування виявилися значно нижчими, ніж очікувалося. Навіть найефективніші AI-агенти змогли успішно виконати лише близько 2–3 % завдань на рівні, який можна вважати професійно прийнятним.
У переважній більшості випадків системи:
- не завершували завдання повністю,
- неправильно інтерпретували вимоги,
- втрачали контекст під час багатокрокових процесів,
- не могли самостійно виправляти помилки або адаптуватися до нових умов.
Примітно, що невдачі зазнали й передові мовні моделі, які демонструють високі результати у стандартних тестах та академічних бенчмарках.
Причини невдач AI-агентів
Аналітики зазначають, що проблема полягає не в окремих технічних помилках, а в природі реальної фріланс-роботи. Такі завдання зазвичай вимагають:
- глибокого розуміння бізнес-контексту,
- самостійного планування дій,
- пріоритезації підзадач,
- уточнення неоднозначних вимог,
- інтеграції з різними інструментами та форматами даних.
Сучасні AI-системи добре працюють у вузько визначених сценаріях, проте демонструють слабкі результати там, де потрібні гнучкість, ініціатива та відповідальність за кінцевий результат.
Значення для ринку праці
Видання GALERA.NEWS зазначає, що висновки дослідження частково знімають напруження навколо теми масової автоматизації віддаленої праці. Хоча штучний інтелект уже активно використовується як допоміжний інструмент — для написання коду, створення чернеток, аналізу даних чи генерації ідей — він поки що не може повноцінно замінити фрілансерів як автономних виконавців проєктів.