|
Treballs academics UPC >
Facultat d'Informàtica de Barcelona >
Enginyeria Informàtica (Pla 2003) >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2099.1/14487
|
| Títol: | Robotlæring for slangeroboter |
| Altres títols: | Robot learning for snake robots |
| Autor: | Monzó Brandvold, Christian |
| Universitat: | Universitat Politècnica de Catalunya Norges teknisk-naturvitenskapelige universitet. |
| Matèries: | Àrees temàtiques de la UPC::Informàtica::Robòtica Mobile robots Robots--Control systems aprendizaje por refuerzo inspección tuberías aprendizaje mecánico reinforcement learning robot inspection pipelines machine learning Robots mòbils Robots -- Sistemes de control |
| Data: | 30-gen-2011 |
| Tipus de document: | Master thesis (pre-Bologna period) |
| Resum: | Developing a control strategy for a wheeled snake robot can be difficult given the number of parameters involved. In this thesis we have studied the use of a reinforcement learning framework to develop a control strategy that allows a wheeled snake to lift its head as much as possible. The learning process has been done using a simulator developed for SINTEF's pipe inspection robot PIKo. The reinforcement learning methodology used has been CACLA with an RBF network as function approximator. Various alternatives have been proposed and used for the action space in simulations showing positive results. Issues with the simulator have been detected and workarounds proposed for them. |
| Descripció: | Treball realitat mitjançant programa de mobilitat. Norges teknisk-naturvitenskapelige universitet.
Institutt for teknisk kybernetikk |
| URI: | http://hdl.handle.net/2099.1/14487 |
| Condicions d'accés: | Open Access |
| Apareix a les col·leccions: | Enginyeria Informàtica (Pla 2003)
|
| Comparteix: |
|
Mostra les estadístiques d'aquest ítem
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|