|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/9904
|
Ítem no disponible en accés obert per política de l'editorial
| Arxiu |
Descripció |
Mida | Format |
| Emerging behaviors by learning joint coordination in articulated mobile robots.pdf | | 767.9 kB | Adobe PDF |  |
|
| Citació: | Pardo, D.; Angulo, C. Emerging behaviors by learning joint coordination in articulated mobile robots. A: International Work-Conference on Artificial Neural Networks. "9th International Work-Conference on Artificial Neural Networks. IWANN 2007". Sant Sebastián: Springer, 2007, p. 806-813. |
| Títol: | Emerging behaviors by learning joint coordination in articulated mobile robots |
| Autor: | Pardo Ayala, Diego Esteban ; Angulo Bahón, Cecilio  |
| Editorial: | Springer |
| Data: | 2007 |
| Tipus de document: | Conference report |
| Descripció: | A Policy Gradient Reinforcement Learning (RL) technique is used to design the low level controllers that drives the joints of articulated mobile robots: A search in the controller’s parameters space.
There is an unknown value function that measures the quality of the controller
respect to the parameters of it. The search is orientated by the approximation of the gradient of the value function. The approximation is made by means of the robot experiences and then the behaviors emerge.
This technique is employed in a structure that processes sensor information to achieve coordination. The structure is based on a modularization principle in which complex overall behavior is the result of the interaction of individual ‘simple’ components. The simple components used are
standard low level controllers (PID) which output is combined, sharing information between articulations and therefore taking integrated control actions. Modularization and Learning are cognitive features, here we
endow the robots with this features. Learning experiences in simulated robots are presented as demonstration. |
| URI: | http://hdl.handle.net/2117/9904 |
| Versió de l'editor: | 10.1007/978-3-540-73007-1_97 |
| Versió de l'editor: | http://www.springerlink.com/content/8759jq6173515421/ |
| Apareix a les col·leccions: | Altres. Enviament des de DRAC Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial. Ponències/Comunicacions de congressos GREC - Grup de Recerca en Enginyeria del Coneixement. Ponències/Comunicacions de congressos
|
| Comparteix: |
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|