Deepmind, el laboratorio de investigación de inteligencia artificial de Google, anunció el desarrollo de un nuevo modelo de IA que aprendió a crear videojuegos en 2D analizando videos de Internet. Bajo el nombre de Genie (Generative Interactive Environments), esta tecnología solo necesita una imagen para generar sus creaciones.
I am really excited to reveal what @GoogleDeepMind's Open Endedness Team has been up to 🚀. We introduce Genie 🧞, a foundation world model trained exclusively from Internet videos that can generate an endless variety of action-controllable 2D worlds given image prompts. pic.twitter.com/TnQ8uv81wc
— Tim Rocktäschel (@_rockt) February 26, 2024
El modelo todavía no está disponible para el público. De acuerdo con sus creadores, si bien Genie es parecido a Sora, el modelo creado por OpenAI, la diferencia radica en que Sora necesita acciones y Genie es controlable a través de acciones, pero es entrenado completamente sin supervisión a partir de videos.
Así, Genia vio 6,8 millones de videos de videojuegos en línea, de los cuales se centró específicamente en clásicos como Super Mario Bros. y Sonic the Hedgehog. Según Big Think, cada clip duraba 16 segundos, lo que significa que Genie vio el equivalente a 30.000 horas de streams de Twitch. Durante el análisis de los videos, la IA determinó qué "acciones latentes" tenían lugar en cada fotograma de animación. Los investigadores limitaron las acciones potenciales a ocho posibilidades: arriba, abajo, izquierda, derecha y las diagonales).
Luego de extraer todos estos datos, Genie pudo generar juegos de plataformas 2D a través de una sola imagen de base. Esta puede ser una foto del mundo real, una creación de texto a imagen realizada por IA o un boceto dibujado a mano, hasta de una servilleta.
Si bien la forma de proceder de la IA es similar a cualquier juego 2D básico, no codifica un juego de la misma forma que lo haría un desarrollador humano. Sobre la base de la imagen recibida, Genie realiza una estimación de cómo debería ser el siguiente fotograma cuando se le da una entrada específica, según cuenta Ars Technica.
Los especialistas reconocen que el programa todavía está en desarrollo y cuenta con algunas limitaciones. Según Tech Xplore, es entre 20 y 30 veces más lento de lo que un jugador medio consideraría una velocidad normal y solo puede ejecutar 16 fotogramas a la vez. Además, puede crear mundos irreales que no son jugables.
Jeff Clune, miembro del equipo que desarrolló Genie, publicó en X que probó la IA con un dibujo que habían hecho sus hijos. No obstante, en el videojuego creado a partir de dos pájaros, cuando caían se fusionaban en uno. El especialista afirmó: "No lo olviden: esto es lo peor que podrá estar. Pronto funcionará perfectamente".
Don't forget: This is the worst it will ever get. Soon it will work perfectly. 🚀📈🚀📈 pic.twitter.com/03sVXq1jvE
— Jeff Clune (@jeffclune) February 26, 2024