Українці тестують найкращі моделі штучного інтелекту 2025: рейтинг LMArena

Аркадій Хвиля15.06.2025

231 2 хвилин читання

Українці тестують найкращі моделі штучного інтелекту 2025 року: прозорий рейтинг LMArena — Джерело: Freepik

У 2025 році українські користувачі активно долучилися до глобального тестування мовних моделей штучного інтелекту через незалежну платформу LMArena. Завдяки інноваційній системі порівняльного голосування, ця платформа стала провідним інструментом для визначення якості сучасних ІІ-рішень. Сотні тисяч людей, зокрема з України, щодня обирають, яка модель ШІ генерує кращі відповіді – пише speka.

Що таке LMArena

LMArena — це незалежна від розробників платформа для порівняльного тестування мовних моделей. Користувач отримує дві відповіді на одне й те саме запитання від двох анонімних моделей, після чого обирає ту, яка здається кращою. Лише після голосування система розкриває, яка саме модель сформувала кожну відповідь.

Цей формат виключає упередженість і дає змогу створити об’єктивний рейтинг, заснований на масових голосуваннях реальних людей, а не лабораторних тестах.

Українці серед найактивніших учасників

За даними платформи, українські користувачі входять до топ-10 за кількістю тестів, які вони проходять щоденно. Це свідчить про високий рівень цифрової грамотності та зацікавленість у розвитку штучного інтелекту в Україні.

Видання GALERA дізналося, що користувачі тестують ШІ в різноманітних напрямках:

генерація текстів українською та англійською;
програмування;
аналіз документів;
переклад і мультимодальні завдання (текст плюс зображення);
креативне письмо.

Найкращі моделі ШІ за результатами тестування

На основі тисяч голосів сформовано оновлений рейтинг, до якого увійшли такі моделі:

GPT-4o (OpenAI) — вирізняється високою точністю, швидкістю і здатністю розуміти запити українською мовою.
Claude 3 Opus (Anthropic) — потужна логічна модель, що добре аналізує складні тексти.
Gemini 1.5 Pro (Google DeepMind) — демонструє відмінні результати в мультимодальних завданнях.
Mistral Large — високоякісна відкрита модель із хорошими результатами в технічних і наукових запитах.
Command R+ (Cohere) — ефективна для коротких, точних відповідей і швидкої генерації інформації.

Актуальні виклики: геолокація за зображенням

У рамках окремого дослідження, проведеного міжнародною розслідувальною організацією Bellingcat, було перевірено здатність сучасних ШІ-моделей визначати географічне розташування об’єктів за зображенням. Результати виявилися неоднозначними: моделі часто припускалися серйозних помилок, частково спираючись на непрямі фактори, як-от текст попередніх запитів або профіль користувача.

Наприклад:

GPT‑4‑mini помилково ідентифікувала зображення афганської локації як об’єкт у США, що могло бути спричинено попередніми згадками користувача.
Grok (xAI), імовірно, враховувала дані з акаунтів у соціальних мережах, що викликало дискусії щодо приватності й етичності таких підходів.

Ці приклади підтверджують, що незважаючи на високий рівень розвитку, сучасні ШІ-моделі досі мають обмеження, зокрема в завданнях, які потребують глибокого розуміння контексту й реального світу.

Платформа LMArena відкриває нові можливості для формування незалежної думки про якість штучного інтелекту. Завдяки активній участі українських користувачів, світові розробники отримують зворотний зв’язок про ефективність своїх рішень у реальних умовах. Це сприяє розвитку моделей, які краще розуміють мову, контекст і культурні особливості України.

Позначки