Adaptación de un videojuego para su uso como entorno de entrenamiento de agentes con capacidades de coordinación

View/Open
Cita com:
hdl:2117/390670
Document typeBachelor thesis
Date2023-05-17
Rights accessOpen Access
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
En este proyecto se ha realizado una búsqueda en ocho entornos que se consideraron aptos para el entrenamiento de agentes que utilicen algoritmos de aprendizaje por refuerzo en misiones de coordinación y se han analizado las características de cada uno para entender qué funcionalidades podrían adaptarse a los objetivos establecidos. Se han definido criterios y métricas que han ayudado a seleccionar el entorno más adecuado para el proyecto, centrándose en la metodología Gym. Un objetivo marcado ha sido el estudio del entorno con tal de entender el funcionamiento del mismo y cómo utilizarlo en el proyecto.Por último, el objetivo final, ha sido implementar un agente de aprendizaje por refuerzo utilizando el algoritmo DQN capaz de realizar una misión sencilla. Una vez que hemos entrenado nuestro agente utilizando un DQN para completar una misión sencilla y utilizando las recompensas que nos devuelven las funciones ya implementadas por MineDojo, nuestro agente no ha sido capaz de completar la misión. Con esto podemos determinar por un lado que se necesitan muchos recursos a nivel de Hardware con tal de entrenar un agente que complete una tarea usando esta combinación de algoritmo y recompensas y que, debido a la naturaleza de este entorno, las misiones que en este se definen suelen ser de naturaleza dispersa o "sparse reward", las cuales no sacan el máximo provecho del DQN.
DegreeGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)
Collections
Files | Description | Size | Format | View |
---|---|---|---|---|
174591.pdf | 23,03Mb | View/Open |