Estudi comparatiu de tècniques de mostreig aplicades a la predicció de resultats acadèmics
Tipus de documentTreball Final de Grau
Data2021-07-12
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-CompartirIgual 3.0 Espanya
Abstract
El present document tracta sobre l’estudi comparatiu del rendiment de diverses tècniques de mineria de dades per a predir si un estudiant aprovarà o suspendrà una determinada assignatura del tercer quadrimestre del Grau en Enginyeria en Tecnologies Industrials de l’ETSEIB. La mineria de dades és un procés que permet obtenir informació molt valuosa a partir de grans bases de dades mitjançant la seva exploració en busca de patrons de conducta que siguin útils per poder predir situacions futures, obtenir beneficis o reduir costos i riscos. Al llarg de tot el projecte s’ha seguit la metodologia CRISP-DM que comprèn totes les etapes necessàries per dur a terme un estudi de mineria de dades de forma adequada i satisfactòria. S’ha fet ús de diverses eines de programació que treballen amb el llenguatge Python, com Jupyter Notebooks i les llibreries Pandas i Scikit-learn. Els algoritmes de predicció emprats han estat la regressió logística i els arbres de decisió. S’ha aplicat diverses tècniques de mostreig com són RandomOverSampler, SMOTE i BorderlineSMOTE amb l’objectiu d’equilibrar la distribució de dades entre les classes aprovat i suspens. Les principals conclusions que s’han obtingut de l’estudi són que la distribució no equilibrada de la variable resposta impacta negativament en el rendiment dels models de predicció i que, per tant, l’aplicació de diferents tècniques de mostreig permet obtenir un augment significatiu en la predicció de la classe minoritària quan les dades estan desequilibrades
MatèriesEscola Tècnica Superior d’Enginyeria Industrial de Barcelona -- Students -- Statistics, Academic achievement -- Evaluation -- Mathematical models, Automatic classification -- Sampling -- Comparative studies, Escola Tècnica Superior d’Enginyeria Industrial de Barcelona -- Estudiants -- Estadístiques, Rendiment escolar -- Avaluació -- Models matemàtics, Classificació automàtica -- Mostreig -- Estudis comparatius, CampusLab
TitulacióGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Localització
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
mem-ria-mar-a-alcalde-olivares.pdf | 1,882Mb | Visualitza/Obre | ||
annex-mar-a-alcalde-olivares.zip | 1,342Mb | application/zip | Visualitza/Obre |