Sistema recomanador per la formaciò d’equips utilitzant reinforcement learning

Valero Masachs, David

Visualitza/Obre

156069.pdf (1,966Mb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Valero Masachs, David

Tutor / directorAngulo Bahón, Cecilio

Tipus de documentTreball Final de Grau

Data2021-01-18

Condicions d'accésAccés obert

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

En el món universitari cada vegada és més freqüent que els estudiants hagin de fer pràctiques en una empresa durant el seu grau universitari, així i tot no hi ha sistemes que simplifiquin la feina d'assignació dels estudiants als diferents projectes oferts per les empreses. Aquest treball final de grau presenta, mitjançant l'ús d'algorismes de reinforcement learning (aprenentatge per reforç), una eina que dóna als estudiants tantes alternatives com es vulgui segons les seves preferències, els projectes que s'ofereixen i els perfils d'estudiants que volen cadascuna de les empreses per cada projecte. A més, també permet que cada estudiant pugui ordenar-les al seu gust i el sistema, intentant satisfer al màxim possible als estudiants, dóna una assignació final. Per dur a terme aquest projecte s'ha utilitzat Python com a llenguatge de programació i la llibreria OpenAI per facilitar la creació de l'entorn. A causa de les característiques del problema, per l'agent s'ha utilitzat la llibreria Stable Baselines i l'algorisme d'aprenentatge per reforç A2C per realitzar la primera assignació. L'assignació final també utilitza la mateixa estructura i algorisme, però per facilitar l'entrenament, un bucle assigna prèviament tots els estudiants que pot assignar directament i l'agent A2C és l'encarregat d'assignar els que no se'ls hi ha pogut assignar cap projecte de la seva llista inicial.

In the university world it is increasingly common for students to do internships in a company during their university degree, but there are no systems that simplify the work of assigning students to the different projects offered by companies. This final degree project presents, through the use of reinforcement learning algorithms, a tool that gives students as many alternatives as they want according to their preferences, the projects that are offered and the student profiles that each of the companies wants for each project. In addition, it also allows each student to order their alternatives to their liking and the system, trying to satisfy as many students as possible, gives a final assignment. To carry out this project Python has been used as a programming language and OpenAI library to facilitate the creation of the environment. Due to the characteristics of the problem, the agent used Stable Baselines library and A2C reinforcement learning algorithm to perform the first assignment. The final assignment also uses the same structure and algorithm, but to facilitate training, a loop pre-assigns all the students it can assign directly. The A2C agent is responsible for assigning students who cannot be assigned to any project on their initial list of alternatives.

MatèriesReinforcement learning, Python (Computer program language), Aprenentatge per reforç, Python (Llenguatge de programació)

TitulacióGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)

URIhttp://hdl.handle.net/2117/340539

Col·leccions

Facultat d'Informàtica de Barcelona - Grau en Enginyeria Informàtica (Pla 2010) [2.478]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
156069.pdf		1,966Mb	PDF	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Sistema recomanador per la formaciò d’equips utilitzant reinforcement learning

Visualitza/Obre

Explora