- Los robots luchan por aprender unos de otros, dependiendo de instrucciones humanas
- Una nueva investigación de la Universidad de California, Berkeley, muestra que el proceso se puede automatizar
- Esto eliminaría la molestia de entrenar robots manualmente.
Aunque los robots se integran cada vez más en entornos del mundo real, un desafío importante en la investigación en robótica es garantizar que los dispositivos puedan adaptarse a nuevas tareas y entornos de manera eficiente.
Tradicionalmente, entrenar para dominar habilidades específicas requiere grandes cantidades de datos y entrenamiento especializado para cada modelo de robot, pero para superar estas limitaciones, los investigadores ahora se están centrando en crear marcos computacionales que permitan la transferencia de habilidades entre diferentes robots.
Un nuevo avance en el campo de la robótica proviene de investigadores de la Universidad de California, Berkeley, que presentaron RoVi-Aug, un marco diseñado para aumentar los datos robóticos y facilitar la transferencia de habilidades.
El desafío de transferir habilidades entre robots
Para facilitar el proceso de capacitación de robots, es necesario poder transferir las habilidades aprendidas de un robot a otro, incluso si estos robots tienen hardware y diseño diferentes. Esta capacidad facilitaría la implementación de robots en una amplia gama de aplicaciones sin tener que volver a capacitar a cada uno desde cero.
Sin embargo, en muchos conjuntos de datos de robótica existentes existe una distribución desigual de escenas y demostraciones. Algunos robots, como Franka y xArm Wizards, dominan estos conjuntos de datos, lo que dificulta generalizar las habilidades aprendidas a otros robots.
Para abordar las limitaciones de los conjuntos de datos y modelos existentes, el equipo de UC Berkeley desarrolló el marco RoVi-Aug que utiliza modelos de difusión modernos para el aumento automatizado de datos. El marco funciona produciendo demostraciones visuales sintéticas que varían en el tipo de robot y los ángulos de la cámara. Esto permite a los investigadores entrenar robots en una gama más amplia de demostraciones, lo que permite una transferencia de habilidades más eficiente.
El marco consta de dos componentes principales: la unidad de ampliación del robot (Ro-Aug) y la unidad de ampliación del punto de vista (Vi-Aug).
El módulo Ro-Aug crea demostraciones que incluyen diferentes sistemas robóticos, mientras que el módulo Vi-Aug crea demostraciones capturadas desde diferentes ángulos de cámara. Juntos, estos módulos proporcionan un conjunto de datos más rico y diverso para entrenar robots, lo que ayuda a cerrar la brecha entre diferentes modelos y tareas.
“El éxito de los sistemas modernos de aprendizaje automático, especialmente los modelos generativos, demuestra una generalización impresionante y motiva a los investigadores de robótica a explorar cómo lograr una generalización similar en la robótica”, Lawrence Chen (candidato a doctorado, AUTOLab, EECS & IEOR, BAIR, UC Berkeley) y Chenfeng Xu (candidato a doctorado, Pallas Lab y MSC Lab, EECS & ME, BAIR, UC Berkeley). Exploración tecnológica.