Unsupervised skill learning from pixels

Creus Castanyer, Roger

Visualitza/Obre

160454.pdf (19,60Mb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Creus Castanyer, Roger

Tutor / directorGiró Nieto, Xavier

; Nieto Salas, Juan José

Tipus de documentTreball Final de Grau

Data2021-06-28

Condicions d'accésAccés obert

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

Aquest treball se centra en l'adquisició del coneixement fonamental agnòstic de tasques disponibles en un entorn. L'objectiu és descobrir i aprendre representacions i comportaments generalistes que puguin ser útils més endavant per resoldre tasques de navegació visual. En concret, l'enfocament presentat amplia la idea de la tècnica "Explore, Discover and Learn" (EDL) al domini dels píxels. D'aquesta manera, aquest treball se centra en les representacions i comportaments que poden ser descoberts i apresos per un agent sense supervisió i que només inclou un sensor de captura d'imatges. Tant els agents com l'entorn que s'utilitzen en aquest treball funcionen amb el simulador d'Habitat AI, desenvolupat per Facebook AI, que proporciona vistes fotorealistes en 3D de l'interior d'apartaments.

This work focuses on the self-acquirement of the fundamental task-agnostic knowledge available within an environment. The aim is to discover and learn baseline representations and behaviours that can later be useful for solving embodied visual navigation downstream tasks. Specifically, the presented approach extends the idea of the "Explore, Discover and Learn" (EDL) paradigm to the pixel domain. This way, this work is centered in the representations and behaviours that can be learnt by an agent that only integrates an image capture sensor. Both the agents and the environment that is used in this work run over the Habitat AI simulator, which is developed by Facebook AI, and renders 3D fotorealistic views of the insides of apartments.

MatèriesReinforcement learning, Artificial intelligence, Aprenentatge per reforç, Intel·ligència artificial

TitulacióGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)

URIhttp://hdl.handle.net/2117/353772

Col·leccions

Facultat d'Informàtica de Barcelona - Grau en Ciència i Enginyeria de Dades (Pla 2017) [118]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
160454.pdf		19,60Mb	PDF	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Unsupervised skill learning from pixels

Visualitza/Obre

Explora