Українські науковці презентували Lapa LLM, першу «національну» мовну модель штучного інтелекту, спеціально створену для міркування та глибокого аналізу тексту. Проєкт став кроком уперед у розвитку українських технологій штучного інтелекту та демонструє можливість створення моделей, які враховують українську мову, культуру та контекст – пише dev.ua.
Що таке Lapa LLM
Lapa LLM — це велика мовна модель, розроблена на базі Gemma від Google (12 мільярдів параметрів), оптимізована для завдань, що потребують логічного мислення та аналізу інформації. На відміну від більшості відкритих LLM, Lapa здатна точніше працювати з українською мовою, завдяки спеціальному токенізатору, який скорочує кількість токенів приблизно на 1,5 рази при обробці тексту. Це підвищує ефективність та зменшує витрати на обчислення.
За внутрішніми бенчмарками розробників, Lapa LLM вже демонструє кращі результати у певних завданнях, ніж більші моделі-конкуренти, зокрема Gemma 3 із 27 мільярдами параметрів.
Основні цілі проєкту
Розробники виділяють три ключові напрямки:
- Національна безпека та конфіденційність
Lapa LLM розрахована на використання в умовах, коли важлива захищеність даних — у корпоративній сфері, державних установах або оборонних структурах. - Культурна та контекстуальна відповідність
Модель навчена з урахуванням українських цінностей та локального контексту. Також передбачено фільтрацію даних, щоб мінімізувати поширення дезінформації чи пропаганди щодо України. - Оптимізація для української мови
Популярні міжнародні LLM часто не справляються з українською. Lapa LLM покликана надолужити цей розрив і забезпечити ефективну роботу з національною мовою.
Реліз та підтримка
Заплановано, що модель, набори даних та навчальні скрипти будуть доступні під ліцензією MIT, що дозволяє вільне використання та модифікацію. Реліз очікується на початку жовтня 2025 року. Проєкт отримав підтримку від Common AI (обчислювальні ресурси) та Hugging Face (корпоративна підписка), що допомогло забезпечити потужну технічну базу для навчання моделі.
Видання GALERA зазначає, що Lapa LLM — це не просто технологічний експеримент. Це перша українська модель штучного інтелекту, яка поєднує національний контекст, міркування та ефективність. Вона може стати фундаментом для майбутніх українських AI-рішень у бізнесі, освіті та державному управлінні.
Дізнайтеся більше про українську велику мовну модель від «Київстар»: мета та основні завдання.