Підрозділ Google DeepMind анонсував випуск нової мовної моделі Gemini Robotics On-Device — вона дозволяє керувати роботами локально, без потреби в інтернет-з’єднанні. Повідомляє видання TechCrunch.
Вдосконалена версія моделі Gemini Robotics, вперше була представлена у березні 2025 року. Тепер користувачі можуть керувати рухами роботів, використовуючи текстові підказки, і при цьому адаптувати модель під різні потреби.
Модель демонструє ефективність, близьку до хмарної версії Gemini Robotics, і перевершує інші моделі, які працюють на пристроях, хоча їхніх назв Google не розголошує. У демонстраціях роботи з новою моделлю виконували побутові завдання — розстібали сумки, складали одяг. Попри початкове навчання для роботів ALOHA, модель була успішно адаптована для роботи з бі-рукою Franka FR3 та людиноподібним роботом Apollo від Apptronik.
Зокрема, Franka FR3 змогла впоратися з невідомими їй раніше об’єктами й задачами, включно зі складанням елементів на виробничій лінії. Для розробників Google також випустила SDK — набір інструментів для навчання роботів. Завдяки йому можна показати машині 50–100 демонстрацій у симуляторі фізики MuJoCo, щоб вона засвоїла нову дію.
Читайте також новину видання GALERA про, що ШІ Gemini панікує під час гри в Pokémon.