Show simple item record

dc.contributorSolano Albajés, Lluís
dc.contributor.authorTudela Alcacer, Jordi
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
dc.date.accessioned2017-10-24T17:26:05Z
dc.date.available2017-10-24T17:26:05Z
dc.date.issued2010-09
dc.identifier.urihttp://hdl.handle.net/2117/109084
dc.description.abstractEn aquest estudi es pretén dissenyar, implementar i analitzar la viabilitat de l’ús de certs esquemes d’aprenentatge automàtic en un prototip de joc per torns basat en les mecàniques de combat en Japanese RolePlaying Games. A tal fi, s’ha dissenyat un entorn de proves en forma de prototip de joc on s’enfronten dos personatges idèntics. Per això, s’ha definit una sèrie d’atributs que regeixen el comportament i l’efectivitat d’un personatge i s’ha dissenyat un conjunt d’accions que poden realitzar durant el seu torn. Per aportar certa complexitat al model, s’ha intentat dotar a cada acció d’un perfil únic amb ratis i elements singulars. Un cop implementats els elements bàsics del prototip que ha de servir com entorn de proves, s’han dissenyat un conjunt d’esquemes bàsics de control per poder entrenar els models basats en aprenentatge automàtic i analitzar-ne el comportament. A tal efecte, s’ha implementat un sistema d’elecció aleatòria d’accions, un sistema d’elecció única i un sistema d’elecció estructurat basat en un arbre de decisions i que, tots tres, funcionen com a referències comparatives per entrenar i avaluar el rendiment dels futurs models. En la part central de l’estudi, s’han dissenyat i implementat dos sistemes de control basats en aprenentatge automàtic. Concretament, s’ha definit un primer sistema basat en els principis de funcionament del Q-Learning, implementant una matriu de recompenses que vinculen els últims moviments del rival a la recompensa associada a escollir una acció particular i s’assumeix que el procés de decisió d’accions és markovianitzable. D’altra banda, també s’ha implementat un sistema basat en xarxes neurals evolutives de topologies ascendents i se n’ha analitzat la funcionalitat a l’hora de trobar models que aproximin correctament un patró guanyador.
dc.language.isocat
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Spain
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Informàtica::Llenguatges de programació
dc.subject.lcshProgramming languages (Computers)
dc.titleEsquemes d'aprenentatge automàtic en videojocs per torns per oferir reptes basats en habilitat
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacLlenguatges de programació
dc.rights.accessOpen Access
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria Industrial de Barcelona
dc.provenanceAquest document conté originàriament altre material i/o programari no inclòs en aquest lloc web


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain