Компанія Google представила оновлення Gemini 2.5 Flash Image — нову модель штучного інтелекту для генерації й редагування зображень, яка забезпечує більш точне виконання візуальних інструкцій без спотворень облич. Оновлення вже доступне в застосунку Gemini, через API, Google AI Studio та платформу Vertex AI. Повідомляє видання GALERA, посилаючись на TechCrunch.
Модель набула популярності в онлайн-спільнотах під псевдонімом “nano-banana” завдяки своїй здатності змішувати зображення, зберігаючи достовірність об’єктів. Google підтвердила, що йдеться саме про її розробку. Оновлення дозволяє об’єднувати декілька зображень, змінювати кольори предметів, додавати елементи до сцен, а також вести “мульти-turn” розмови з ШІ-моделлю. Це відкриває нові можливості, зокрема для візуалізації дизайну інтер’єрів.
Новинка також має низку обмежень. Наприклад, заборонено створення зображень інтимного характеру без згоди, а всі згенеровані картинки маркуються візуальними водяними знаками й метаданими. На відміну від конкурентів, таких як Grok від xAI, Google намагається балансувати між творчою свободою користувача і відповідальністю за безпечний контент.
Розробники вважають, що нова модель допоможе Google надолужити розрив з OpenAI, чий ChatGPT наразі має понад 700 млн активних користувачів щотижня, тоді як Gemini — 450 млн щомісячно.