Show simple item record

dc.contributorRosell Gratacòs, Jan
dc.contributor.authorUrcera I Martín, Guillermo
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial
dc.date.accessioned2018-05-29T12:41:50Z
dc.date.available2018-05-29T12:41:50Z
dc.date.issued2018-04-27
dc.identifier.urihttp://hdl.handle.net/2117/117602
dc.description.abstractEl proyecto explora las oportunidades que ofrece el aprendizaje automático por refuerzo al campo de la robótica mediante la implementación del algoritmo por refuerzo profundo DDPG, inspirado en los gradientes de políticas deterministas, para evaluarlo en una serie de entornos diferentes, con diferentes arquitecturas y parámetros. También se compara su rendimiento con el del planificador de última generación KPIECE en el campo de la planifi- cación de movimientos. El proyecto se diseña con un enfoque práctico, con posibilidad de llegar a implementar los métodos estudiados en robots reales.
dc.language.isospa
dc.publisherUniversitat Politècnica de Catalunya
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Informàtica
dc.subject.lcshMachine learning
dc.subject.lcshRobots
dc.titleGeneración de trayectorias robóticas mediante aprendizaje profundo por refuerzo
dc.typeMaster thesis
dc.subject.lemacAprenentatge automàtic
dc.subject.lemacRobots
dc.identifier.slugETSEIB-240.131448
dc.rights.accessOpen Access
dc.date.updated2018-05-14T05:34:20Z
dc.audience.educationlevelMàster
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria Industrial de Barcelona


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain