Роботы научились понимать. И не команды — а саму реальность

Пускай, пока лишь чуть чуть.


Google представила обновлённый ИИ Gemini Robotics-ER 1.6, который помогает роботам понимать окружающий мир, а не просто следовать командам. Основное нововведение — embodied reasoning, или способность "электроника" анализировать обстановку, разбивать задачи на шаги и проверять их выполнение. Это важный шаг для робототехники: дроид не просто выполняет команды, но и адаптируется к изменениям, быстро меняя стратегию.

Новая версия улучшила пространственное восприятие и работу с несколькими источниками изображения. Робот точнее определяет расположение предметов, их взаимосвязь и видимость с разных камер. Это особенно важно в условиях ограниченной видимости, беспорядка и динамичных изменений.

Gemini Robotics-ER 1.6 стал лучше распознавать объекты, считать их и понимать взаимосвязи. Модель может указывать на предметы во время рассуждения, что упрощает выполнение сложных задач, таких как навигация по загромождённым помещениям или выбор нужных предметов.

Google также улучшила проверку результатов. Модель теперь точнее оценивает выполнение задач, что важно для автоматизации. Робот понимает, достаточно ли его действий или нужно повторить попытку.

Обновление многокамерной обработки позволяет роботам объединять данные с разных ракурсов, улучшая восприятие сцены. Это полезно, когда часть объекта скрыта, освещение плохое или камера показывает лишь часть сцены.

Новая функция — чтение показаний приборов. Модель распознаёт данные манометров, смотровых стёкол и цифровых дисплеев, что полезно в промышленной робототехнике. Google разработала эту функцию совместно с Boston Dynamics, чьи роботы Spot используются для инспекции оборудования.

Для считывания показаний модель использует визуальный анализ и код. Она может увеличивать изображение, выделять важные элементы и точно вычислять значения. Точность чтения приборов выросла с 23% до 93% в режиме "видение агента"(agentic vision).

Google утверждает, что новая модель стала безопаснее. Она осторожнее обращается с опасными объектами и лучше распознаёт рискованные ситуации. Gemini Robotics-ER 1.6 — самая безопасная нейросеть Google на сегодняшний день.

Новая версия решает одну из главных проблем робототехники: соответствие между цифровым планом и реальным миром, который постоянно меняется. Gemini Robotics-ER 1.6 уже доступна разработчикам через Gemini API и Google AI Studio с инструментами для тестирования и создания приложений, где робот должен не только выполнять команды, но и понимать окружающую обстановку.

29 мая 2026, 23:47 | Просмотры: 4

Добавить новый комментарий

Для добавления комментария, пожалуйста войдите

0 комментариев