Aplicació de tècniques de potenciació del gradient a la predicció de resultats acadèmics
Cita com:
hdl:2117/369149
Document typeBachelor thesis
Date2022-05-03
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-ShareAlike 3.0 Spain
Abstract
Aquest document és la memòria escrita sobre l’estudi predictiu dels resultats acadèmics dels estudiants del Grau en Enginyeria en Tecnologies Industrials de l’ETSEIB. Concretament, s’han utilitzat tècniques de potenciació del gradient (Gradient Boosting) per predir si els estudiants del Grau, un cop superat el primer curs, aprovaran o suspendran les assignatures del tercer quadrimestre del Pla d’estudis. Aquest estudi s’ha pogut realitzar gràcies al gran volum de dades acadèmiques disponibles sobre els estudiants de l’ETSEIB. Per tal d’aprofitar el màxim potencial de les dades, s’ha emprat la metodologia CRISP-DM, que especifica quines són les diferents fases d’un projecte de mineria de dades i les tasques corresponents a realitzar. Una gran part de les tasques han sigut de programació i s’han realitzat mitjançant la plataforma Anaconda, amb l’entorn de programació Spyder. S’ha emprat el llenguatge Python i, principalment, s’han utilitzat les llibreries Pandas i Sklearn. Les principals conclusions que s’han tret al realitzar l’estudi són que el Gradient Boosting aconsegueix fer millors prediccions que altres models més simples i encara obtindria un rendiment predictiu superior si no fos per la baixa qualitat de les dades amb què s’ha treballat i el fet que estan desequilibrades. S’hauria de millorar la base de dades per poder fer prediccions més encertades.
DegreeGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Files | Description | Size | Format | View |
---|---|---|---|---|
tfg-sara-provost.pdf | 4,096Mb | View/Open | ||
codi-python.zip | 7,728Kb | application/zip | View/Open |