НовиниСвіт

Anthropic представила Opus 4.5

Anthropic оголосила про запуск Opus 4.5, завершальної моделі лінійки 4.5 після Sonnet та Haiku. Новинка демонструє рекордні результати на ключових тестах: SWE-Bench, Terminal-bench, tau2-bench, MCP Atlas, ARC-AGI 2 та GPQA Diamond. Opus 4.5 стала першою моделлю, що подолала 80% на SWE-Bench verified — одному з найскладніших бенчмарків для програмування.

Повідомляє видання GALERA.NEWS, посилаючись на TechCrunch

Разом з релізом компанія розширює доступність своїх інструментів для роботи з браузером і таблицями: Claude for Chrome стане доступним для всіх користувачів Max, а Claude for Excel — для Max, Team та Enterprise. Модель позиціюють як надзвичайно сильну в автоматизації комп’ютерних задач та роботи зі складними табличними даними.

Opus 4.5 отримала значні покращення в довготривалій пам’яті та управлінні контекстом. Це дозволило реалізувати функцію «endless chat», коли модель автоматично стискає контекст і продовжує діалог без переривань і попереджень. Такий підхід важливий для агентних сценаріїв, де Opus може виступати «головним агентом», керуючи підагентами на базі Haiku.

Anthropic зазначає, що оновлення пам’яті стали фундаментальними для роботи з великими кодовими базами та документами — модель тепер краще «знає», які деталі потрібно утримувати, а коли повертатися назад.

Opus 4.5 виходить на тлі посилення конкуренції: OpenAI запустила GPT 5.1 12 листопада, а Google представила Gemini 3 18 листопада.

Back to top button