Now showing items 1-20 of 79

    • A Learning Approach to Solving Automatic Control Problems 

      Parellada Calderer, Benjami (Universitat Politècnica de Catalunya, 2022-10-18)
      Bachelor thesis
      Restricted access - author's decision
      Els problemes de control automàtic poden ser extremadament difícils de resoldre per a qualsevol algoritme no adaptatiu. El control automàtic implica l'avaluació en temps real de les respostes d'un sistema que es retroalimenta ...
    • A reinforcement learning path planning approach for range-only underwater target localization with autonomous vehicles 

      Masmitjà Rusiñol, Ivan; Martín Muñoz, Mario; Katija, Kakani; Gomáriz Castro, Spartacus; Navarro Bernabé, Joan (Institute of Electrical and Electronics Engineers (IEEE), 2022)
      Conference report
      Open Access
      Underwater target localization using range-only and single-beacon (ROSB) techniques with autonomous vehicles has been used recently to improve the limitations of more complex methods, such as long baseline and ultra-short ...
    • Adaptación de un videojuego para su uso como entorno de entrenamiento de agentes con capacidades de coordinación 

      Sancho-Tello Bayarri, Xavier (Universitat Politècnica de Catalunya, 2023-05-17)
      Bachelor thesis
      Open Access
      En este proyecto se ha realizado una búsqueda en ocho entornos que se consideraron aptos para el entrenamiento de agentes que utilicen algoritmos de aprendizaje por refuerzo en misiones de coordinación y se han analizado ...
    • Adaptive optics control with multi-agent model-free reinforcement learning 

      Pou Mulet, Bartomeu; Ferreira, Florian; Quiñones Moreno, Eduardo; Gratadour, Damien; Martín Muñoz, Mario (2022-01-14)
      Article
      Open Access
      We present a novel formulation of closed-loop adaptive optics (AO) control as a multi-agent reinforcement learning (MARL) problem in which the controller is able to learn a non-linear policy and does not need a priori ...
    • Agentes inteligentes para imitar el comportamiento de los jugadores de pádel 

      Lopez Rodríguez, Ivan (Universitat Politècnica de Catalunya, 2022-06-29)
      Bachelor thesis
      Open Access
      La idea principal del trabajo era la de generar una aplicación de pádel mediante Unity y su librería ML-agents. Por tanto, con la ayuda de la librería entrenaríamos distintos agentes para que aprendieran a jugar a pádel ...
    • An application of explainability methods in reinforcement learning 

      Climent Muñoz, Antoni (Universitat Politècnica de Catalunya, 2020-07-02)
      Bachelor thesis
      Open Access
      La popularidad de los métodos explicativos está aumentando en el contexto de la Inteligencia Artificial y consiste en dar explicaciones inteligibles a modelos complejos. Recientemente, en el contexto del Aprendizaje Reforzado ...
    • Applying and verifying an explainability method based on policy graphs in the context of reinforcement learning 

      Climent Muñoz, Antoni; Gnatyshak, Dmitry; Álvarez Napagao, Sergio (IOS Press, 2021)
      Conference report
      Open Access
      The advancement on explainability techniques is quite relevant in the field of Reinforcement Learning (RL) and its applications can be beneficial for the development of intelligent agents that are understandable by humans ...
    • Applying multi-agent reinforcement learning to solve sequential moral dilemmas 

      Choinski, Michal (Universitat Politècnica de Catalunya, 2021-04-26)
      Master thesis
      Open Access
      Covenantee:   Universitat de Barcelona. Facultat de Matemàtiques i Informàtica / Universitat Rovira i Virgili
      Incorporation of ethical values in the field of Artificial Intelligence is inevitable. With the rapid development of technologies capable of making autonomous decisions, more attention should be dedicated to the process ...
    • Applying the rainbow architecture to intrusion detection systems 

      Izquierdo García-Faria, Tomás (Universitat Politècnica de Catalunya, 2021-04-28)
      Master thesis
      Open Access
      There is a lot of expectation on how Artificial Intelligence (AI) is going to have an impact on Cybersecurity. From new sophisticated attacks to new ways of defending a system from cybercriminals. A lot of techniques are ...
    • Aprendizaje por refuerzo aplicado a los videojuegos cooperativos 

      Alcocer Soto, Daniel (Universitat Politècnica de Catalunya, 2018-07)
      Bachelor thesis
      Open Access
      Se ha desarrollado un algoritmo que combina el uso de redes neuronales con el algoritmo Q-learning para aprender a jugar con la ayuda de un jugador humano y aprender a cooperar con él para ganar en un videojuego basado en ...
    • Aprendizaje por refuerzo aplicado a personajes no controlables en Minetest 

      Romero Reviriego, Aitor (Universitat Politècnica de Catalunya, 2019-01)
      Bachelor thesis
      Open Access
      En este proyecto se ha utilizado la rama de la IA llamada aprendizaje por refuerzo y intenta desarrollar agentes para el videojuego Minetest que actúen como aliados del jugador.
    • Aprendizaje por refuerzo y generación procedural evolutiva para un videojuego de estrategia 

      Amat Bujaldon, Carlos (Universitat Politècnica de Catalunya, 2021-10-25)
      Bachelor thesis
      Open Access
    • Aprenentatge aplicat al NL Texas Hold'em 

      Perapoch Amadó, Marçal (Universitat Politècnica de Catalunya, 2014-06-06)
      Master thesis (pre-Bologna period)
      Open Access
      Aquest projecte consisteix en la construcció d'un sistema software que permeti observar el comportament i resultats d'aplicar tècniques d'Intel·ligència Artificial al domini que engloba el conegut joc de cartes: Pòquer.
    • Aprenentatge de reforç aplicat a jocs d'informació imperfecta i suma zero 

      Cristino Marcos, Víctor (Universitat Politècnica de Catalunya, 2023-06)
      Master thesis
      Open Access
    • Auto-scaling a video-conference platform with Reinforcement learning 

      Roy Campderrós, Francesc (Universitat Politècnica de Catalunya, 2021-10-18)
      Master thesis
      Open Access
      One of the capabilities that video-conferencing platforms are expected to have, as well as other distributed services, is being able to scale horizontally. This is because workload is not constant in a lot of applications, ...
    • Autonomous driving with CARLA 

      Martínez Martel, Enrique (Universitat Politècnica de Catalunya, 2022-07-01)
      Bachelor thesis
      Open Access
      La intención de esta tesis es establecer una base en el mundo de la inteligencia artificial, específicamente en CARLA, un simulador de conducción autónoma de código abierto. El objetivo principal de este trabajo es conseguir ...
    • Combining long-short term memory and reinforcement learning for improved autonomous network operation 

      Tabatabaeimehr, Fatemehsadat; Barzegar, Sima; Ruiz Ramírez, Marc; Velasco Esteban, Luis Domingo (Institute of Electrical and Electronics Engineers (IEEE), 2021)
      Conference report
      Open Access
      A combined LSTM and RL approach is proposed for dynamic connection capacity allocation. The LSTM predictor anticipates periodical long-term sharp traffic changes and extends short-term RL knowledge. Numerical results show ...
    • Countering a drone in a 3D space: Analyzing deep reinforcement learning methods 

      Cetin, Ender; Barrado Muxí, Cristina; Pastor Llorens, Enric (Multidisciplinary Digital Publishing Institute (MDPI), 2022-11-16)
      Article
      Open Access
      Unmanned aerial vehicles (UAV), also known as drones have been used for a variety of reasons and the commercial drone market growth is expected to reach remarkable levels in the near future. However, some drone users can ...
    • Creation of an agent in reinforcement learning using explainability methods in a complex environment 

      Perelló Comas, Bartomeu (Universitat Politècnica de Catalunya, 2021-10-25)
      Bachelor thesis
      Open Access
      La inteligencia artificial es una de las áreas de la computación que se encuentra actualmente en auge, este trabajo se encuentra bajo el marco del aprendizaje por refuerzo. El aprendizaje por refuerzo se centra en la ...
    • Deep reinforcement learning IA para Starcraft 2 

      Roldán Montaner, Carlos (Universitat Politècnica de Catalunya, 2018-06)
      Bachelor thesis
      Open Access
      Este proyecto intenta desarrollar agentes de aprendizaje por refuerzo para escenarios concretos de Starcraft 2 y sacar conclusiones sobre cuales son las dificultades más importantes y los enfoques más adecuados para afrontar ...