Nueva Tecnología Robótica Aumenta Éxito en Tareas Multi-Robot

RoVi-Aug permite a los robots compartir habilidades sin intervención humana, optimizando el aprendizaje multi-robot con datos sintéticos y diversas perspectivas, aumentando la eficiencia y reduciendo la dependencia de pruebas extensas

Ingenieros desarrollan un marco innovador para que los robots compartan habilidades de forma autónoma

Un grupo de ingenieros ha creado un marco innovador que permite a los robots compartir habilidades entre distintos modelos de manera autónoma.

Llamado RoVi-Aug, este sistema elimina la necesidad de intervención humana en el proceso de aprendizaje, simplificando la capacitación de los robots. Las pruebas físicas muestran que RoVi-Aug se entrena con datos mejorados para funcionar de inmediato con nuevos robots, sin importar los ángulos de las cámaras. A diferencia de otros métodos, evita pasos adicionales durante las pruebas, adapta políticas y aprende tareas multi-robot, lo que aumenta la eficiencia del traspaso de habilidades y eleva la tasa de éxito hasta un 30%.

Según el equipo de la Universidad de California en Berkeley, este enfoque representa un avance significativo hacia robots más independientes y adaptables.

Escalado adaptativo de datos

Las investigaciones demuestran que ampliar la cantidad de datos mejora la capacidad de los robots para aprender habilidades generales y fiables. Sin embargo, los datos robóticos son mucho más limitados que los utilizados en modelos avanzados de IA para visión y lenguaje. Recoger datos diversos y útiles del mundo real es lento, requiere mucho trabajo y es difícil de equilibrar para un entrenamiento adaptable.

Modelos existentes, como el proyecto Open-X Embodiment (OXE), combinan datos de 60 conjuntos robóticos para mejorar el aprendizaje cruzado entre robots. Esto les permite compartir experiencias y mejorar sus capacidades. No obstante, los investigadores señalan que el conjunto de datos está desequilibrado, dominado por robots específicos como Franka y xArm, y carece de diversidad en los ángulos de las cámaras, lo que provoca sobreajustes y la necesidad de ajustes al usar robots o perspectivas diferentes.

Para resolverlo, el algoritmo Mirage adapta robots desconocidos mediante “cross-painting”, haciéndolos parecerse a los utilizados en el entrenamiento. Aunque es eficaz para aprendizaje sin datos previos, Mirage presenta inconvenientes: necesita modelos de robots precisos, no permite ajustes finos y tiene problemas con cambios significativos en las cámaras.

El trabajo de UC Berkeley presenta a RoVi-Aug como una solución avanzada para superar las limitaciones de las técnicas actuales de aprendizaje robótico.

Avances en la capacitación robótica

RoVi-Aug enseña a los modelos a comprender explícitamente la interacción entre los robots y las tareas dentro de los datos, en contraste con métodos convencionales que co-entrenan ingenuamente datos fusionados de múltiples robots.

Este marco genera demostraciones visuales sintéticas que varían según el tipo de robot y los ángulos de cámara, haciendo el entrenamiento más versátil. Está compuesto por dos módulos principales: Ro-Aug, que genera demostraciones con distintos sistemas robóticos, y Vi-Aug, que simula demostraciones desde diversas perspectivas de cámara.

Al combinar estos módulos, se obtiene un conjunto de datos más diverso, lo que permite a los robots aprender de una amplia gama de escenarios, transfiriendo habilidades de manera eficiente entre modelos y tareas, reduciendo la necesidad de recopilar datos del mundo real.

Según los investigadores, este enfoque mejora la robustez y la generalización de las políticas, eliminando la dependencia de ajustes precisos durante las pruebas, como las canalizaciones de cross-painting. A diferencia de Mirage, RoVi-Aug no requiere matrices de cámaras conocidas y permite ajustes finos, mejorando significativamente el rendimiento en tareas complejas. Además, RoVi-Aug facilita el aprendizaje de políticas multi-robot y multi-tarea al co-entrenar tanto datos originales como aumentados.

Aunque RoVi-Aug logra un puente entre conjuntos de datos robóticos y mejora la transferencia de habilidades, los investigadores reconocen ciertas limitaciones. Futuras investigaciones podrían abordar cambios de fondo, mejorar la síntesis de perspectivas, unificar modelos de pares de robots y manejar mejor los artefactos.

La generalización podría fortalecerse ampliando el sistema a diferentes tipos de pinzas, como manos multifuncionales, e integrando la ampliación de objetos y tareas.

Los detalles de la investigación fueron publicados previamente en ArXiv.

Vía | Nueva Tecnología Robótica Aumenta Éxito en Tareas Multi-Robot – Tecnología con Juancho