MamayLM — це велика мовна модель (LLM), створена спеціально для української мови дослідниками з INSAIT у співпраці з ETH Zurich – highload.tech. INSAIT – науково-дослідний інститут світового рівня в галузі комп’ютерних наук і штучного інтелекту, який є частиною Софійського університету та розташований у Софії, Болгарія. Названа модель на честь козака Мамая, ця модель несе в собі дух незалежності, культури та сили. MamayLM побудована на основі архітектури Gemma 2 від Google і містить 9 мільярдів параметрів — справжній гігант, що вміщається на одну GPU.
Двомовність — сила
Модель з інтегрованим ШІ не лише чудово справляється з українською мовою, а й володіє англійською на високому рівні. Це відкриває двері для широкого використання в міжнародному середовищі, зберігаючи при цьому культурну специфіку українського мовлення.
Навчання з любов’ю до мови
Штучний інтелект MamayLM навчався на масивному корпусі — 75 мільярдів токенів українською та англійською мовами. Серед джерел — FineWeb2, CulturaX, проєкт Malyuk, українська Вікіпедія та інші багаті мовні ресурси. Завдяки цьому модель не просто “розуміє” українську — вона відчуває її ритм, інтонацію, структуру.
Перевірка якості на завданнях ЗНО
Особливо вражає той факт, що MamayLM успішно пройшла тестування на базі реальних завдань Зовнішнього Незалежного Оцінювання (ЗНО). Це дозволяє об’єктивно оцінити її здатність працювати з академічними текстами, логікою української мови, розумінням прочитаного та граматичною точністю.
Швидкість, доступність, відкритість
Модель легко запускається локально, що є ключовою перевагою в умовах обмеженого доступу до хмарних сервісів або бажання зберігати конфіденційність. Hugging Face пропонує MamayLM у відкритому доступі — як у повному, так і в оптимізованому (квантованому) форматі.
Український бенчмарк — перший у своєму роді
Видання GALERA зазначає, що разом із моделлю автори презентували відкриті українські бенчмарки — набір тестів, які дозволяють оцінити якість роботи мовних моделей саме в українському контексті. Це значущий внесок у світову спільноту розробників, і ще один крок до лінгвістичної автономії.