Enlaces para accesibilidad

OpenAI y brazos robóticos


Jonas Schneider, investigador de OpenAI, examina el brazo robótico de su laboratorio. San Francisco, California, 26-7-18.
Jonas Schneider, investigador de OpenAI, examina el brazo robótico de su laboratorio. San Francisco, California, 26-7-18.

¿Cuánto tiempo tarda una mano robótica en aprender a hacer malabares con un cubo?

Unos 100 años, más o menos.

Ese es el tiempo de computación virtual que les tomó a los investigadores de OpenAI, el laboratorio de inteligencia artificial sin fines de lucro financiado por Elon Musk y otros, entrenar su mano incorpórea. El equipo pagó a Google $ 3.500 para ejecutar su software en miles de computadoras simultáneamente, calculando el tiempo real en 48 horas. Después de entrenar al robot en un entorno virtual, el equipo lo puso a prueba en el mundo real.

La mano, llamada Dactyl, aprendió a moverse, el equipo de dos docenas de investigadores dio a conocer esta semana. Su trabajo es simplemente ajustar el cubo de manera que una de sus letras, "O", "P", "E", "N", "A" o "I", mire hacia arriba para coincidir con una selección aleatoria.

Ken Goldberg, profesor de robótica de la Universidad de California en Berkeley, que no está afiliado al proyecto, dijo que el logro de OpenAI es importante porque demuestra cómo los robots entrenados en un entorno virtual pueden operar en el mundo real. Su laboratorio está intentando algo similar con un robot llamado Dex-Net, aunque su mano es más simple y los objetos que manipula son más complejos.

"La clave es la idea de que puedes avanzar tanto en la simulación", dijo. "Este es un camino plausible, cuando hacer experimentos físicos es muy difícil".

Los dedos del mundo real de Dactyl son rastreados por puntos infrarrojos y cámaras. En el entrenamiento, cada movimiento simulado que acercó el cubo a la meta le dio a Dactyl una pequeña recompensa.

El proceso se llama aprendizaje de refuerzo. El software del robot repite los intentos millones de veces en un entorno simulado, intentándolo una y otra vez para obtener la mayor recompensa. OpenAI usó aproximadamente el mismo algoritmo que usó para vencer a jugadores humanos en un videojuego, Dota 2.

En la vida real, un equipo de investigadores trabajó aproximadamente un año para obtener la mano mecánica hasta este punto.

¿Por qué?

Por un lado, la mano en un entorno simulado no comprende la fricción. Dactyl carece de la comprensión humana sobre los mejores agarres.

Los investigadores inyectaron su entorno simulado con cambios en la gravedad, el ángulo de la mano y otras variables para que el software aprenda a funcionar de una manera adaptable. Eso ayudó a reducir la brecha entre los resultados del mundo real y los simulados, que eran mucho mejores.

Las variaciones ayudaron a que la mano tuviera éxito poniendo la letra correcta boca arriba más de una docena de veces seguidas antes de soltar el cubo. En la simulación, la mano generalmente tuvo éxito 50 veces seguidas antes de detener la prueba.

El objetivo de OpenAI es desarrollar inteligencia artificial o máquinas que piensen y aprendan como seres humanos, de una manera que sea segura para las personas y ampliamente distribuida.

Musk ha advertido que si los sistemas de IA son desarrollados solo por compañías con fines de lucro o gobiernos poderosos, algún día podrían superar la inteligencia humana y ser más peligrosos que una potencial guerra nuclear con Corea del Norte.

XS
SM
MD
LG