Unsupervised skill learning from pixels
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/353772
Tipus de documentTreball Final de Grau
Data2021-06-28
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Aquest treball se centra en l'adquisició del coneixement fonamental agnòstic de tasques disponibles en un entorn. L'objectiu és descobrir i aprendre representacions i comportaments generalistes que puguin ser útils més endavant per resoldre tasques de navegació visual. En concret, l'enfocament presentat amplia la idea de la tècnica "Explore, Discover and Learn" (EDL) al domini dels píxels. D'aquesta manera, aquest treball se centra en les representacions i comportaments que poden ser descoberts i apresos per un agent sense supervisió i que només inclou un sensor de captura d'imatges. Tant els agents com l'entorn que s'utilitzen en aquest treball funcionen amb el simulador d'Habitat AI, desenvolupat per Facebook AI, que proporciona vistes fotorealistes en 3D de l'interior d'apartaments. This work focuses on the self-acquirement of the fundamental task-agnostic knowledge available within an environment. The aim is to discover and learn baseline representations and behaviours that can later be useful for solving embodied visual navigation downstream tasks. Specifically, the presented approach extends the idea of the "Explore, Discover and Learn" (EDL) paradigm to the pixel domain. This way, this work is centered in the representations and behaviours that can be learnt by an agent that only integrates an image capture sensor. Both the agents and the environment that is used in this work run over the Habitat AI simulator, which is developed by Facebook AI, and renders 3D fotorealistic views of the insides of apartments.
MatèriesReinforcement learning, Artificial intelligence, Aprenentatge per reforç, Intel·ligència artificial
TitulacióGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
160454.pdf | 19,60Mb | Visualitza/Obre |