У Сан-Франциско з’явилася нова амбітна AI-компанія — Deep Cogito, яка вийшла з режиму «стелс» і представила серію відкритих гібридних мовних моделей Cogito 1. Ці моделі здатних перемикатися між режимами звичайних відповідей і так званого “розмірковування”. Повідомляє видання TechCrunch.
На відміну від звичних моделей, гібридна архітектура дозволяє економити ресурси при простих запитах і водночас застосовувати багатоступеневу логіку при складних завданнях — таких як математика чи фізика. Такий підхід уже використовується провідними лабораторіями, зокрема в Anthropic та OpenAI.
Що особливого в Cogito 1?
Моделі Cogito 1 мають розмір від 3 до 70 мільярдів параметрів, і компанія планує випустити версії до 671 мільярда параметрів у найближчі місяці. Параметри — це внутрішні налаштування моделі, які визначають її здатність до аналізу й генерації.
Згідно з власними тестами Deep Cogito:
- Cogito 70B з увімкненим режимом мислення перевершує модель DeepSeek R1 у математичних і мовних завданнях.
- У звичайному режимі Cogito 70B обійшла Llama 4 Scout від Meta на тесті LiveBench.
- Кожна модель може: – відповідати швидко й прямо, як звичайна LLM
- – або “поміркувати”, виконуючи самоперевірку перед відповіддю.
Компанія не створювала моделі з нуля — базою стали відкриті моделі Meta LLaMA та Qwen від Alibaba, які були донавчені з використанням власних методик, що забезпечують якісно нову поведінку.
Моделі Cogito 1 доступні для завантаження, а також через API на платформах Fireworks AI і Together AI.