OpenAI виправить “підлесливий” ChatGPT

Сергій Красовський03.05.2025

69 1 хвилина читання

OpenAI виправить "підлесливий" ChatGPT — Джерело: Pexels

Нещодавня хвиля критики, щодо надмірної люб’язності ChatGPT знайшла відповідь. Компанія OpenAI оголосила про внесення низки змін у процес оновлення своїх моделей штучного інтелекту, які живлять ChatGPT. Повідомляє видання TechCrunch.

OpenAI розгорнула оновлену версію моделі GPT-4o, яка за замовчуванням використовується в ChatGPT. Майже одразу користувачі почали скаржитися на те, що модель ChatGPT поводиться надмірно привітно, підтримуючи навіть небезпечні або абсурдні ідеї.

У відповідь CEO OpenAI Сем Альтман визнав проблему у дописі на платформі X і пообіцяв «якнайшвидше виправити ситуацію». OpenAI описала нові кроки для запобігання подібним інцидентам у майбутньому. Серед них:

Запуск альфа-фази з можливістю участі користувачів, які зможуть тестувати нові моделі до офіційного релізу.
Окрема публікація про обмеження та ризики кожного нового оновлення.
Оновлений процес перевірки безпеки, який включає оцінку таких факторів, як особистість моделі, схильність до обману, достовірність та “галюцинації” — і ці фактори розглядатимуться як критично важливі перед запуском.

OpenAI також підтвердила, що експериментуватиме з механізмами реального зворотного зв’язку від користувачів, які зможуть прямо впливати на взаємодію з ChatGPT. У планах — вдосконалення методів уникнення підлесливості, можливість вибору особистості моделі, нові захисні механізми, а також розширені тестування для виявлення прихованих проблем.

Читайте також новину видання GALERA про зростання ринку праці українського IT-сектору.

Позначки