Mostra el registre d'ítem simple

dc.contributorMartín Muñoz, Mario
dc.contributor.authorPou Mulet, Bartomeu
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Ciències de la Computació
dc.date.accessioned2020-01-26T21:35:58Z
dc.date.available2020-01-26T21:35:58Z
dc.date.issued2019-10-16
dc.identifier.urihttp://hdl.handle.net/2117/175740
dc.description.abstractIn this master thesis, we have tried to solve two of most prominent Reinforcement Learning problems: sparse rewards and sample efficiency. The combination of Model Based Reinforcement Learning, Hindsight Experience Replay and off-policy methods is the approach we took to solve the problems.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.subjectÀrees temàtiques de la UPC::Informàtica
dc.subject.lcshReinforcement learning
dc.subject.lcshAlgorithms
dc.subject.otherModel Based Reinforcement Learning
dc.subject.otherHindsight Experience Replay
dc.subject.otheroff-policy methods
dc.subject.othersparse rewards
dc.subject.othersample efficiency.
dc.titleSpeeding up Reinforcement Learning with Learned Models
dc.typeMaster thesis
dc.subject.lemacAprenentatge per reforç
dc.subject.lemacAlgorismes
dc.identifier.slug143210
dc.rights.accessOpen Access
dc.date.updated2019-10-28T05:00:50Z
dc.audience.educationlevelMàster
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.audience.degreeMÀSTER UNIVERSITARI EN INTEL·LIGÈNCIA ARTIFICIAL (Pla 2017)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple