Son casi tres minutos de vídeo de lo que parece una de esas aventuras gráficas de antaño donde el jugador debía elegir el camino a seguir a través de una batería de preguntas y respuestas. De aspecto medieval y acompañados por un avatar que hace de anfitrión, en el juego Evertrail nada parece raro, incluso la música que acompaña va acorde con la atmósfera. Sin embargo, lo que vemos es algo nuevo. Lo hizo un usuario de Reddit en apenas unas semanas con la única ayuda de las herramientas de IA, Dall-E y ChatGPT. Se trata de la primera aventura gráfica generada por IA en tiempo real.
El usuario Phil subió hace unas horas el vídeo a Reddit. Como vamos a ver, todo nos resulta familiar para quienes hemos jugado alguna vez a este tipo de aventuras gráficas del pasado, con un esquema muy sencillo, obvio, pero es que lo ha hecho una sola persona en un período de tiempo impensable hasta hace poco.
Veamos primero la pieza antes de seguir explicando lo conseguido:
Phil luego ha respondido a los usuarios sobre todas las dudas acerca del proyecto. Como él mismo comenta, se trata de una aventura generada por IA en tiempo real, la primera que se sepa, donde los usuarios pueden votar y agregar cosas a través del chat de Twitch (por cierto, en las últimas horas la aventura también está disponible en alemán y suponemos que en breve en cualquier idioma).
Existe también una página oficial del juego que tiene todos los enlaces y comandos de Twitch. Para conectar al propio canal de un usuario de la red social hay que enviar un mensaje a Phil para que pueda desbloquear el estado de tu mod en el canal.
El autor comenta en Reddit que el anfitrión que nos acompaña en el título (Evy) y comenta las elecciones del jugador necesita ajustes porque lo acaba de incorporar hace unos días. El avatar lo hizo en ReadyPlayerMe y luego usó el módulo TalkingHead. Para el “cerebro” utilizó la API de ChatGPT4 y para la voz, las de OpenAI. Entre otras posibilidades, piensa en añadirle modales y/o humor de la época en la que se desarrolle cada historia.
La música que escuchamos en el juego también se creó a través de IA, en este caso a través de SunoAi (hablamos del programa hace unos días). Al parecer, el sistema de IA para la creación de melodías las generó y clasificó de antemano en grupos de estados de ánimo para cada escenario con un estilo musical diferente. Además, cada “escenario tiene unas 100 canciones y luego le pido a la API de ChatGPT que elija el ambiente adecuado para cada estación”, cuenta Phil.
Un usuario no parece creer lo que ve y le replica si de verdad se trata de una historia dinámica que depende de las respuestas de un usuario. La respuesta del autor:
En efecto, se genera sobre la marcha, en función de los votos, así como de los +elementos/giros que puedes agregar cada pocas rondas. Trabajé en esto las últimas semanas. Se realiza en Nodejs con muchas API de OpenAI. Hay fantasía, ciencia ficción, historias de crímenes y más.
Por supuesto, hay fallos que pulir. Por ejemplo, otro usuario que ha estado jugando le pregunta por la posibilidad de “silenciar” a otros jugadores, un momento algo cómico por lo que cuenta:
¿Algún tipo de filtro para las personas que hacen tonterías en el chat? Estamos en una búsqueda mágica en ruinas místicas y algunos están hablando de perros salchicha, otra vez… y destruye la inmersión.
En cualquier caso, pensemos por un momento que esto no es obra de un estudio, es obra de una sola persona con herramientas de IA al alcance de todos en muy poco tiempo.
Por cierto, en cuanto al coste que le ha llevado la creación del título, Phil cuenta que desde que agregó el host, los costes aumentaron un poco, “ahora podría costar alrededor de $50 por día. Sin embargo, escala de tal manera que luego no importa si hay 5 o 500 personas en el chat, esa es más o menos la razón por la que elegí Twitch, para que solo haya un punto para agrupar todos los costes de API… ¡Cuantos más, mejor!”.
Simplemente alucinante.