Los estudios de juegos han tratado durante mucho tiempo las pruebas como un cuello de botella inevitable: ventilado, repetitivo y costoso. Pero un nuevo estudio sugiere que uno de los trabajos más intensivos en humanos del desarrollo del juego puede estar maduro para la automatización.
Investigadores de la Universidad de Zhejiang y el Laboratorio de AI de NetEase Fuxi presentaron a Titan, un agente de pruebas con IA que utiliza un razonamiento de modelos de gran lenguaje para explorar y evaluar grandes mundos de juegos de roles en línea.
En las pruebas de dos títulos comerciales, Titan no solo completó el 95% de las tareas asignadas, sino que también identificó cuatro errores previamente desconocidos, con el rendimiento de los probadores humanos en términos de velocidad, cobertura y descubrimiento.
Las pruebas son una de las fases más caras de la producción de juegos, que consume millones de dólares en mano de obra y meses de tiempo de respuesta. Según la firma de investigación de mercado Dataintello, se espera que el mercado mundial de servicios de pruebas de juegos alcance los $ 5.8 mil millones para 2032.
Los resultados de Titan sugieren que la IA generativa puede asumir una parte de esa carga, llevando la automatización a una disciplina que una vez se pensó demasiado abierta e impredecible para las máquinas.
El estudio sugiere un futuro en el que los agentes de IA no solo imitan a los jugadores sino también a los jugadores razón Me gusta: identificar fallas, mecánica de equilibrio y navegar entornos virtuales dinámicos de manera más eficiente que los equipos de QA humanos.
“Diseñamos el flujo de trabajo de Titan reflejando cómo los probadores expertos operan las pruebas MMORPG: percibir el estado del juego, elegir acciones significativas, reflexionar sobre el progreso y diagnosticar problemas”, escribieron los investigadores. “En su núcleo, un modelo de base impulsa un razonamiento de alto nivel, mientras que los módulos de apoyo proporcionan percepción, andamios de acción y oráculos de diagnóstico para la interacción de circuito cerrado”.
En el experimento, un módulo de percepción tradujo los estados de juego complejos en texto simplificado, lo que permite que el programa razone a través de los objetivos. El agente también usó capturas de pantalla para revisar su propio progreso y recuperarse del progreso estancado.
Por que importa
Titan es el último ejemplo de cómo AI se está moviendo hacia la industria del juego y llenando los roles típicamente manejados por los humanos. En agosto, una encuesta de Google Cloud dijo que casi nueve de cada 10 desarrolladores de juegos dicen que ya han incorporado a los agentes de IA en su trabajo.
“Si no estás en el carro de IA en este momento, ya estás atrasado”, dijo recientemente Kelsey Falter, CEO y cofundadora de Indie Studio Mother Games, Descifrar.
La investigación se produce en medio de esfuerzos más amplios para integrar la IA más profundamente en los flujos de trabajo de desarrollo. En agosto, Jack Buser, director de Global Games en Google Cloud, advirtió que los estudios que no pueden adoptar herramientas de IA “no sobrevivirán”.
Un nuevo tipo de probador de juegos
Los probadores humanos a menudo siguieron caminos familiares, señaló el informe, mientras que los bots existentes lucharon para generalizarse en las versiones de los juegos. Sin embargo, los investigadores reconocieron que no confiaban únicamente en la IA para completar el estudio.
“Trabajamos con probadores y diseñadores profesionales para identificar los factores estatales clave relevantes para el progreso general en MMORPG, que sirven como referencias de plantilla”, dijeron los investigadores.
Estas referencias de plantilla incluyen la ubicación del jugador, los objetivos del juego actual y los vitales de los jugadores como la salud y el maná, mientras que los “datos irrelevantes” como la información de otros jugadores se filtra a menos que sea necesario.