Distributed Deep Reinforcement Learning in an HPC system and deployment to the Cloud

Escobar Castells, Miquel

Visualitza/Obre

161112.pdf (14,03Mb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Escobar Castells, Miquel

Tutor / directorTorres Viñals, Jordi

; García Fuentes, Raúl

Tipus de documentTreball Final de Grau

Data2021-07-01

Condicions d'accésAccés obert

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

Combinar l'aprenentatge per reforç amb l'aprenentatge profund és, a dia d'avui, un dels reptes més grans en el sector d'investigació en intel·ligència artificial. Escalar aquest tipus d'aplicacions mitjançant supercomputadors o serveis al núvol és crucial per avançar en l'ús massiu d'aquestes tecnologies. L'objectiu d'aquest projecte és desenvolupar i testejar vàries implementacions d'algorismes de Deep Reinforcement Learning (DRL) sobre el cas d'estudi seleccionat, utilitzant el clúster CTE-POWER del Barcelona Supercomputing Center (BSC), així com fer un desplegament al núvol dels entrenaments per analitzar els seus costos i viabilitat en un entorn de producció.

Combining Reinforcement Learning and Deep Learning is the most challenging Artificial Intelligence research and development area at present. Scaling these types of applications in an HPC infrastructure available in the cloud will be crucial for advancing the massive use of these technologies. The purpose of this project is to develop and test various implementations of Deep RL algorithms given a selected case study, using Barcelona Supercomputing Center's (BSC) CTE-POWER cluster, and make a deployment to the cloud of the training pipeline to analyze its costs and viability in a production environment.

Combinar el aprendizaje por refuerzo con el aprendizaje profundo es, a día de hoy, el desafío más grande en el sector de desarrollo e investigación en inteligencia artificial. Escalar este tipo de aplicaciones mediante supercomputadores o servicios en la nube es crucial para avanzar en el uso masivo de estas tecnologías. El objetivo de este proyecto es desarrollar y testear varias implementaciones de algoritmos de Deep Reinforcement Learning (DRL) sobre el caso de estudio seleccionado, usando el cluster CTE-POWER del Barcelona Supercomputing Center (BSC), así como hacer un despliegue a la nube de los entrenamientos para analizar sus costes y viabiliadad en un entorno de producción

MatèriesReinforcement learning, Deep learning, Cloud computing, Artificial intelligence, Aprenentatge per reforç, Aprenentatge profund, Computació en núvol, Intel·ligència artificial

TitulacióGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)

URIhttp://hdl.handle.net/2117/355310

Col·leccions

Facultat d'Informàtica de Barcelona - Grau en Ciència i Enginyeria de Dades (Pla 2017) [118]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
161112.pdf		14,03Mb	PDF	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Distributed Deep Reinforcement Learning in an HPC system and deployment to the Cloud

Visualitza/Obre

Explora