Нещодавня хвиля критики, щодо надмірної люб’язності ChatGPT знайшла відповідь. Компанія OpenAI оголосила про внесення низки змін у процес оновлення своїх моделей штучного інтелекту, які живлять ChatGPT. Повідомляє видання TechCrunch.
OpenAI розгорнула оновлену версію моделі GPT-4o, яка за замовчуванням використовується в ChatGPT. Майже одразу користувачі почали скаржитися на те, що модель ChatGPT поводиться надмірно привітно, підтримуючи навіть небезпечні або абсурдні ідеї.
У відповідь CEO OpenAI Сем Альтман визнав проблему у дописі на платформі X і пообіцяв «якнайшвидше виправити ситуацію». OpenAI описала нові кроки для запобігання подібним інцидентам у майбутньому. Серед них:
- Запуск альфа-фази з можливістю участі користувачів, які зможуть тестувати нові моделі до офіційного релізу.
- Окрема публікація про обмеження та ризики кожного нового оновлення.
- Оновлений процес перевірки безпеки, який включає оцінку таких факторів, як особистість моделі, схильність до обману, достовірність та “галюцинації” — і ці фактори розглядатимуться як критично важливі перед запуском.
OpenAI також підтвердила, що експериментуватиме з механізмами реального зворотного зв’язку від користувачів, які зможуть прямо впливати на взаємодію з ChatGPT. У планах — вдосконалення методів уникнення підлесливості, можливість вибору особистості моделі, нові захисні механізми, а також розширені тестування для виявлення прихованих проблем.
Читайте також новину видання GALERA про зростання ринку праці українського IT-сектору.