Google anuncia dos modelos de IA para robots humanoides

Estas innovaciones permiten a los robots realizar tareas complejas en el mundo real con mayor precisión, interacción y adaptabilidad

Por Emmanuel Escamilla | 12 Marzo 2025

Google DeepMind dio un paso significativo en el desarrollo de la robótica al presentar dos nuevos modelos de inteligencia artificial, diseñados para mejorar la autonomía y eficiencia de los robots humanoides.

Se trata de Gemini Robotics y Gemini Robotics-ER, ambos impulsados por el avanzado modelo Gemini 2.0, que amplía las capacidades de los robots en el mundo físico.

Inteligencia artificial para robots más diestros y autónomos

Según Google, para que la IA sea verdaderamente útil en la robótica, los modelos deben ser capaces de adaptarse a diversas situaciones, interactuar con su entorno de manera fluida y realizar tareas con precisión y destreza.

Con esta visión, Gemini Robotics se presenta como un modelo de visión-lenguaje-acción (VLA), capaz de interpretar comandos e interactuar con el entorno mediante acciones físicas. Gracias a su capacidad para resolver tareas de varios pasos, los robots pueden ejecutar actividades complejas, como plegar origami o introducir un bocadillo en una bolsa con cierre zip.

Por su parte, Gemini Robotics-ER es un modelo de visión-lenguaje (VLM) con una comprensión espacial avanzada. Esta tecnología permite a los robots calcular la mejor manera de manipular objetos; por ejemplo, al identificar una taza de café, el sistema puede determinar automáticamente la forma correcta de sujetarla por el asa y acercarse a ella sin errores.

Robots más inteligentes y adaptables

Uno de los principales desafíos en la robótica ha sido la capacidad de adaptación de los modelos a diferentes estructuras físicas. En respuesta a esto, Google DeepMind diseñó Gemini Robotics para que pueda integrarse en una amplia variedad de robots con distintas formas y tamaños.

Además, la compañía está trabajando en colaboración con Apptronik, una empresa especializada en robótica humanoide, para desarrollar la siguiente generación de robots con estas capacidades mejoradas.

Google también ha creado un grupo de probadores de confianza que ayudarán a perfeccionar Gemini Robotics-ER y explorar nuevas aplicaciones en el mundo real.

Hasta ahora, la inteligencia artificial de Google ha demostrado su capacidad para resolver problemas complejos en entornos digitales, mediante el análisis de texto, imágenes, audio y video. Sin embargo, su implementación en el mundo físico ha sido un reto.

Con el lanzamiento de Gemini Robotics y Gemini Robotics-ER, Google busca desarrollar robots que no solo comprendan su entorno, sino que también sean capaces de reaccionar de forma segura y efectiva a los cambios en tiempo real.

“Estos modelos sientan las bases de una nueva generación de robots útiles”, explicó Google DeepMind en su blog oficial.

Inteligencia artificial para robots más diestros y autónomos

Robots más inteligentes y adaptables

Comentarios