
Image by Oberon Copeland, from Unsplash
La IA Soñadora de Google Aprende a Jugar Minecraft Sin Entrenamiento
Un nuevo sistema de IA de Google DeepMind ha descubierto cómo recolectar diamantes en Minecraft, uno de los desafíos más difíciles del juego, sin ninguna instrucción humana.
¿Apurada? Aquí están los datos rápidos:
- Dreamer AI dominó la búsqueda de diamantes en Minecraft sin guía humana.
- La IA utilizó la imaginación para predecir los resultados de las acciones.
- Dreamer alcanzó el nivel de experto en nueve días.
La IA, llamada Dreamer, se enseñó a sí misma a jugar Minecraft y alcanzó el nivel experto en solo nueve días. Lo hizo simplemente imaginando los resultados futuros de sus propias acciones, según se informó en un estudio publicado en Nature.
“El avance de Dreamer marca un paso significativo hacia los sistemas de inteligencia artificial general”, dijo Danijar Hafner, científico informático de Google DeepMind, según informó Tech Xplore. “Permite que la inteligencia artificial comprenda su entorno físico y también se auto-mejore con el tiempo, sin que un humano tenga que decirle exactamente qué hacer”, agregó.
Minecraft es jugado por más de 100 millones de usuarios mensuales, quienes experimentan mundos 3D generados aleatoriamente. Para encontrar diamantes, los usuarios necesitan jugar múltiples pasos, comenzando con la recolección de madera, seguido de la creación de herramientas, luego la construcción de hornos, la extracción de hierro, y finalmente la excavación subterránea.
El proceso normalmente requiere varias horas de juego para la mayoría de los jugadores. Sin embargo, Dreamer utilizó ‘aprendizaje por refuerzo’ para descubrir nuevas acciones, reteniendo los intentos exitosos e ignorando los fracasos. El equipo proporcionó pequeñas recompensas por cada paso, como fabricar una tabla y extraer hierro. Luego, reiniciaban el juego cada treinta minutos para evitar la memorización de patrones.
A diferencia de los sistemas de inteligencia artificial más antiguos que ‘observaban’ el juego humano para aprender, Dreamer operaba de manera autónoma, y no requería demostraciones humanas ni guías paso a paso. La función de creación del “modelo de mundo” interno del sistema le permitía predecir los resultados de las acciones antes de realizarlas.
“El modelo mundial realmente equipa al sistema de IA con la capacidad de imaginar el futuro”, dijo Hafner, según informó Tech Xplore. Jeff Clune, un experto en IA de la Universidad de Columbia Británica, calificó el logro como un “gran paso adelante para el campo”, informó Tech Xplore.
Mientras que los humanos pueden localizar un diamante en aproximadamente 20-30 minutos, Dreamer necesitó nueve días para hacer lo mismo. Sin embargo, los investigadores creen que este trabajo tiene implicaciones de gran alcance más allá de los videojuegos.
“Esto podría ayudar a los robots a enseñarse a sí mismos cómo alcanzar objetivos en el mundo real”, agregó Hafner, según se informó en Tech Xplore.
Dejar un comentario
Cancelar