Show simple item record

dc.contributorTorres Viñals, Jordi
dc.contributorGarcía Fuentes, Raúl
dc.contributor.authorEscobar Castells, Miquel
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors
dc.date.accessioned2021-11-02T18:43:36Z
dc.date.available2021-11-02T18:43:36Z
dc.date.issued2021-07-01
dc.identifier.urihttp://hdl.handle.net/2117/355310
dc.description.abstractCombinar l'aprenentatge per reforç amb l'aprenentatge profund és, a dia d'avui, un dels reptes més grans en el sector d'investigació en intel·ligència artificial. Escalar aquest tipus d'aplicacions mitjançant supercomputadors o serveis al núvol és crucial per avançar en l'ús massiu d'aquestes tecnologies. L'objectiu d'aquest projecte és desenvolupar i testejar vàries implementacions d'algorismes de Deep Reinforcement Learning (DRL) sobre el cas d'estudi seleccionat, utilitzant el clúster CTE-POWER del Barcelona Supercomputing Center (BSC), així com fer un desplegament al núvol dels entrenaments per analitzar els seus costos i viabilitat en un entorn de producció.
dc.description.abstractCombining Reinforcement Learning and Deep Learning is the most challenging Artificial Intelligence research and development area at present. Scaling these types of applications in an HPC infrastructure available in the cloud will be crucial for advancing the massive use of these technologies. The purpose of this project is to develop and test various implementations of Deep RL algorithms given a selected case study, using Barcelona Supercomputing Center's (BSC) CTE-POWER cluster, and make a deployment to the cloud of the training pipeline to analyze its costs and viability in a production environment.
dc.description.abstractCombinar el aprendizaje por refuerzo con el aprendizaje profundo es, a día de hoy, el desafío más grande en el sector de desarrollo e investigación en inteligencia artificial. Escalar este tipo de aplicaciones mediante supercomputadores o servicios en la nube es crucial para avanzar en el uso masivo de estas tecnologías. El objetivo de este proyecto es desarrollar y testear varias implementaciones de algoritmos de Deep Reinforcement Learning (DRL) sobre el caso de estudio seleccionado, usando el cluster CTE-POWER del Barcelona Supercomputing Center (BSC), así como hacer un despliegue a la nube de los entrenamientos para analizar sus costes y viabiliadad en un entorno de producción
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.subjectÀrees temàtiques de la UPC::Informàtica::Intel·ligència artificial
dc.subject.lcshReinforcement learning
dc.subject.lcshDeep learning
dc.subject.lcshCloud computing
dc.subject.lcshArtificial intelligence
dc.subject.otheraprenentatge per reforç
dc.subject.otherRL
dc.subject.otheraprenentatge per reforç profund
dc.subject.otherDRL
dc.subject.otherHPC
dc.subject.othercloud
dc.subject.otherRay
dc.subject.otherAWS
dc.subject.otherSageMaker
dc.subject.otherReinforcement Learning
dc.subject.otherRL
dc.subject.otherDeep Reinforcement Learning
dc.subject.otherDRL
dc.subject.otherHPC
dc.subject.othercloud
dc.subject.otherRay
dc.subject.otherAWS
dc.subject.otherSageMaker
dc.titleDistributed Deep Reinforcement Learning in an HPC system and deployment to the Cloud
dc.typeBachelor thesis
dc.subject.lemacAprenentatge per reforç
dc.subject.lemacAprenentatge profund
dc.subject.lemacComputació en núvol
dc.subject.lemacIntel·ligència artificial
dc.identifier.slug161112
dc.rights.accessOpen Access
dc.date.updated2021-09-13T05:58:39Z
dc.audience.educationlevelGrau
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.audience.degreeGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

All rights reserved. This work is protected by the corresponding intellectual and industrial property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public communication or transformation of this work are prohibited without permission of the copyright holder