Aplicació dels models de regressió logística i k-Nearest Neighbours a la predicció de resultats acadèmics

View/Open
Tutor / director / evaluatorTalavera Mendez, Luis José
Document typeBachelor thesis
Date2020-02-06
Rights accessOpen Access
Abstract
El present document tracta sobre l’anàlisi del rendiment de tècniques de mineria de dades aplicades en la predicció de l’aprovat o suspès dels estudiants de l’ETSEIB en assignatures corresponents al Q3. La mineria de dades és el procés d’extracció d’informació significativa d’un conjunt de dades mitjançant la identificació de patrons i tendències. Les tècniques de predicció emprades són la regressió logística i l’algorisme K-Nearest Neighbors. El procés d’anàlisi està adaptat a la metodologia CRISP DM que comprèn les diferents etapes que cal seguir per poder aplicar un model de mineria de dades. A partir dels resultats obtinguts s’han contrastat els dos models de predicció utilitzats. El software utilitzat durant el treball ha estat Python i s’ha fet ús de les seves llibreries Pandas, scikit-learn i la distribució Anaconda com a IDE. La conclusió principal que s’extreu del treball és que, en general, K-Nearest Neighbors és millor que la regressió logística. Tanmateix, hi ha assignatures on els resultats no són satisfactoris, probablement degut a la distribució de classes desequilibrada. A la secció final es proposen alternatives per tal de millorar l’anàlisi.
Files | Description | Size | Format | View |
---|---|---|---|---|
tfg-carlavidal.pdf | 2,212Mb | View/Open |
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-ShareAlike 3.0 Spain