Aplicació de tècniques de potenciació del gradient a la predicció de resultats acadèmics
Tipus de documentTreball Final de Grau
Data2022-05-03
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-CompartirIgual 3.0 Espanya
Abstract
Aquest document és la memòria escrita sobre l’estudi predictiu dels resultats acadèmics dels estudiants del Grau en Enginyeria en Tecnologies Industrials de l’ETSEIB. Concretament, s’han utilitzat tècniques de potenciació del gradient (Gradient Boosting) per predir si els estudiants del Grau, un cop superat el primer curs, aprovaran o suspendran les assignatures del tercer quadrimestre del Pla d’estudis. Aquest estudi s’ha pogut realitzar gràcies al gran volum de dades acadèmiques disponibles sobre els estudiants de l’ETSEIB. Per tal d’aprofitar el màxim potencial de les dades, s’ha emprat la metodologia CRISP-DM, que especifica quines són les diferents fases d’un projecte de mineria de dades i les tasques corresponents a realitzar. Una gran part de les tasques han sigut de programació i s’han realitzat mitjançant la plataforma Anaconda, amb l’entorn de programació Spyder. S’ha emprat el llenguatge Python i, principalment, s’han utilitzat les llibreries Pandas i Sklearn. Les principals conclusions que s’han tret al realitzar l’estudi són que el Gradient Boosting aconsegueix fer millors prediccions que altres models més simples i encara obtindria un rendiment predictiu superior si no fos per la baixa qualitat de les dades amb què s’ha treballat i el fet que estan desequilibrades. S’hauria de millorar la base de dades per poder fer prediccions més encertades.
TitulacióGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
tfg-sara-provost.pdf | 4,096Mb | Visualitza/Obre | ||
codi-python.zip | 7,728Kb | application/zip | Visualitza/Obre |