Mostra el registre d'ítem simple

dc.contributorAranda López, Juan
dc.contributorOcampo-Martínez, Carlos
dc.contributorMartínez Piazuelo, Juan Pablo
dc.contributor.authorParellada Calderer, Benjami
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial
dc.date.accessioned2023-01-18T12:42:43Z
dc.date.issued2022-10-18
dc.identifier.urihttp://hdl.handle.net/2117/380694
dc.description.abstractEls problemes de control automàtic poden ser extremadament difícils de resoldre per a qualsevol algoritme no adaptatiu. El control automàtic implica l'avaluació en temps real de les respostes d'un sistema que es retroalimenta sota condicions incertes. Aquestes circumstàncies d'incertesa són freqüents en diferents àrees d'enginyeria, que van des de simples controls de vàlvules fins a la conducció autònoma d'última generació. Tot i que s'ha demostrat que els algoritmes de control clàssics funcionen, actualment la tendència de crear sistemes altament complexos i més grans fa que els mètodes clàssics anteriors no sempre es puguin aplicar amb efectivitat. Això sol ser degut per la falta de dades per dissenyar el model matemàtic, o per tenir múltiples elements controlables dins del sistema. Veient com altres branques, com la Teoria de Jocs, modelen problemes amb aquestes característiques, proposem enfocaments procedents de l'Aprenentatge Per Reforç per resoldre aquest tipus de situacions en una metodologia basada en dades i sense models matemàtics. Concretament, presentem un estudi sobre diversos algoritmes d'aprenentatge de reforç multiagent i els apliquem als sistemes de drenatge urbà per provar-ne l'eficàcia. Els sistemes de drenatge urbà (UDS) són xarxes d'interconnexió de canonades i instal·lacions d'emmagatzematge que transporten les aigües residuals a les estacions de tractament d'aigües residuals, abans d'alliberar l'aigua a les masses d'aigua properes, eliminant-les de productes químics perillosos.
dc.description.abstractAutomatic Control problems can be extremely challenging for any non-adapting algorithm to solve. Control involves the real-time evaluation of system responses under uncertain circumstances, and can be encountered in different areas of engineering, ranging from simple valve controls to State-of-the-Art autonomous driving. While classical control algorithms have been proven to work, in a trend of creating more complex and larger systems these previous methods cannot be always applied. This is usually due to incomplete data to design the mathematical model, or having multiple controllable elements in a system. Seeing how these types of problem can be modeled with Game Theory, we propose approaches coming from Reinforcement Learning to solve these sorts of situations in a model-free data-driven methodology. Concretely, we present a study on various Multi-Agent Reinforcement Learning algorithms and apply them on Urban Drainage Systems to test their efficacy. Urban Drainage Systems (UDS) are networks of interconnecting pipes and storage facilities that transport wastewater to Waste Water Treatment Plants, before releasing the water into nearby water bodies, removing them of dangerous chemicals.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.subjectÀrees temàtiques de la UPC::Informàtica::Intel·ligència artificial
dc.subject.lcshMachine learning
dc.subject.lcshReinforcement learning
dc.subject.lcshMultiagent systems
dc.subject.otherIntel·ligència Artificial
dc.subject.otherAprenentatge Automàtic
dc.subject.otherAprenentatge Per Reforç
dc.subject.otherSistemes Multiagent
dc.subject.otherControl Automàtic
dc.subject.otherSistemes de Drenatge Urbans
dc.subject.otherArtificial Intelligence
dc.subject.otherMachine Learning
dc.subject.otherReinforcement Learning
dc.subject.otherMulti-Agent Systems
dc.subject.otherAutomatic Control
dc.subject.otherUrban Drainage Systems
dc.titleA Learning Approach to Solving Automatic Control Problems
dc.typeBachelor thesis
dc.subject.lemacAprenentatge per reforç
dc.subject.lemacSistemes multiagent
dc.subject.lemacAprenentatge automàtic
dc.identifier.slug171262
dc.rights.accessRestricted access - author's decision
dc.date.lift10000-01-01
dc.date.updated2022-10-25T04:01:19Z
dc.audience.educationlevelGrau
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.audience.degreeGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)


Fitxers d'aquest items

Imatge en miniatura

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple