Міністерство цифрової трансформації України спільно з компанією «Київстар» активно просувається у створенні національної великої мовної моделі (LLM), яка стане ключовим елементом стратегії цифровізації держави та входження України до трійки світових лідерів у сфері штучного інтелекту (ШІ) до 2030 року. Проєкт реалізується без залучення державних бюджетних коштів у часи воєнного стану, з повним фінансуванням з боку приватного партнера.
Офіційна інформація підтверджена віцепрем’єр-міністром – міністром цифрової трансформації Михайлом Федоровим у Telegram-каналі.
Стратегічна мета та ключові партнери
Національна LLM розробляється на базі сімейства моделей Gemma від стратегічного партнера Google, що забезпечує використання передових технологій, адаптованих до української мови та національного контексту. Компанія «Київстар» виступає технічним і фінансовим партнером, забезпечуючи ресурси для розробки, після чого модель буде передана державі для безоплатного використання в державному секторі, обороні, бізнесі та освіті.
Якість моделі контролюватиме незалежна група експертів з різних галузей. Вони оцінюватимуть її за критеріями:
- технічної якості;
- етичності та безпеки для користувачів;
- володіння української мовою;
- розуміння національного контексту.
Паралельно створюється правовий фреймворк для відповідального поводження з даними, а також власні бенчмарки – стандартизовані тести для оцінки ефективності та безпеки моделі.
Поточний етап розробки
На сьогодні триває ключовий етап – збір унікальних даних для навчання моделі. Для досягнення високої якості недостатньо відкритих інтернет-джерел: залучаються державні органи, медіа, університети та інші інституції, що забезпечує терабайти якісних україномовних текстів. Ці дані дозволять моделі глибше розуміти українські діалекти, термінологію, історичний та культурний контекст, перевершуючи глобальні аналоги на кшталт ChatGPT.
До кінця січня 2026 року планується досягти таких результатів:
- формування першої бази текстів для тренування;
- впровадження покращеного токенізатора для оптимізації обробки української мови;
- завершення розробки національних бенчмарків.
Навесні 2026 року розпочнеться бета-тестування, доступне для широкого кола користувачів. Назву моделі визначать громадяни України через голосування у мобільному застосунку «Дія», яке стартує у січні.
Проєкт реалізується в рамках WINWIN AI Center of Excellence при Мінцифрі, з урахуванням міжнародного досвіду країн-лідерів ШІ.
Видання GALERA.NEWS зазначає, що Міністерство цифрової трансформації закликає бізнес, науковців та громадськість до співпраці для прискорення цифрової трансформації України.