Show simple item record

dc.contributorBermejo Sánchez, Sergi
dc.contributor.authorPalma Pérez, Juan
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament d'Enginyeria Electrònica
dc.date.accessioned2016-12-02T14:15:34Z
dc.date.available2016-12-02T14:15:34Z
dc.date.issued2016
dc.identifier.urihttp://hdl.handle.net/2117/97712
dc.descriptionDevelopment of low computational algorithms based on reinforcement learning for microrobots
dc.description.abstractThe aim of this project is the study of reinforcement learning algorithms for micro-robots. It begins with the description of the collective intelligence concept and its main characteristics. Then it presents concepts such as collective Robotics and more specifically the robots based on behavior, as well as some real-world applications. Also it presents various existing control strategies and behavior design methods that can be used. Following, a general overview reinforcement learning is given. Afterwards a more specific type of algorithm called Q-learning is covered. By means of a micro-programmable robot, the learning algorithms Q-learning are put into practice with different architectures of behaviors. Conclusion about the effects of the different parameters of the algorithms, as well as the different used architectures are drawn thanks to the practical implementation.
dc.description.abstractEl siguiente proyecto tiene como objetivo el estudio de los algoritmos de aprendizaje por refuerzo en micro-robots. Empieza con la descripción del concepto inteligencia colectiva i sus características principales. Seguidamente se presentan conceptos como la robótica colectiva y más concretamente los robots basados en el comportamiento, así como algunas aplicaciones reales. También se muestran diferentes estrategias de control existentes y métodos de diseño de comportaments que se pueden utilizar. A continuación, se da una visión general del aprendizaje por refuerzo, para posteriormente, tratar más concretamente un tipo de algoritmo llamado Q-learning. Mediante un micro-robot programable, se ponen en práctica los algoritmos de aprendizaje por refuerzo Q-Learning con diferentes arquitecturas de comportamiento. Gracias a la implementación práctica se extraen conclusiones de los efectos que tienen los diferentes parámetros del algoritmo, así como las diferentes arquitecturas utilizadas.
dc.description.abstractEl següent projecte té com a objectiu l’estudi dels algorismes d’aprenentatge per a reforç en micro-robots. Comença amb la descripció del concepte intel·ligència col·lectiva i les seves característiques principals. Seguidament es presenten conceptes com la robòtica col·lectiva i més concretament els robots basats en el comportament, així com algunes aplicacions reals. També es mostren diferents estrategies de control existents i mètodes de disseny de comportament que es poden fer servir. A continuació, es dona una visió general de l’aprenentatge per reforç, per posteriorment, tractar més concretament un tipus d’algorisme anomenat Q-learning. Mitjançant un micro-robot programable, es posen en pràctica els algorismes d’aprenentatge per reforç Q-learning amb diferents arquitectures de comportaments. Gràcies a la implementació pràctica es treuen conclusions dels efectes que tenen els diferents paràmetres dels algorismes, així com les diferents arquitectures emprades.
dc.language.isocat
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria electrònica
dc.subject.lcshRobots -- Programming
dc.subject.lcshMachine learning
dc.subject.otherAutomatic learning
dc.subject.otherAprendizaje automático
dc.titleAlgorismes d'aprenentatge per reforç en micro-robots
dc.title.alternativeReinforcement learning algorithms for micro-robots
dc.title.alternativeAlgoritmos de aprendizaje por refuerzo en micro-robots
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacRobots -- Programació
dc.subject.lemacAprenentatge automàtic
dc.identifier.slugETSETB-230.121757
dc.rights.accessOpen Access
dc.date.updated2016-10-07T05:50:58Z
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain