Estudi del rendiment de tècniques de mineria de dades en la predicció de resultats acadèmics

View/Open
Document typeBachelor thesis
Date2019-01-17
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-ShareAlike 3.0 Spain
Abstract
El present document tracta sobre l’anàlisi del rendiment de tècniques de mineria de dades aplicades en la predicció de l’aprovat o suspès dels estudiants de l’ETSEIB en assignatures corresponents al Q3. La mineria de dades és el procés d’extracció d’informació significativa dins d’un conjunt de dades, permetent identificar patrons i arribar a predir futures situacions. Les tècniques de predicció emprades só n l’arbre de decisió i el mecanisme Bagging prenent l’arbre de decisió com a estimador base. Tot el procés d’anàlisi ha estat adaptat a la metodologia CRISP (un dels models referència en la mineria de dades), des de la preparació de les dades fins la vali dació dels models. A partir dels resultats obtinguts en la validació s’han pogut contrastar els dos mètodes de predicció utilitzats. Les eines utilitzades en el treball giren entorn al llenguatge de programació Python i són totes de programari lliure. Con cretament, s’ha fet ús de les llibreries Pandas i scikit - learn i la distribució Anaconda com a IDE. La conclusió principal que s’extreu del projecte és que les dades que es disposen són poc representatives per tal de poder ser predites. Les precisions de predicció són relativament baixes en els dos mecanismes utilitzats. Al final del treball es troba una secció de treball futur on es proposen alternatives d’estudi per tal d’aprofundir l’anàlisi.
DegreeGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Files | Description | Size | Format | View |
---|---|---|---|---|
tfg-montseheng.pdf | 5,098Mb | View/Open |