Aplicación de modelos de regresión en la predicción de calificaciones de estudiantes de la ETSEIB
Cita com:
hdl:2117/339686
Document typeBachelor thesis
Date2021-11-01
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-ShareAlike 3.0 Spain
Abstract
El presente documento trata sobre el estudio de técnicas de regresión para la predicción de las calificaciones del tercer cuatrimestre de los alumnos del Grado en Ingeniería en Tecnologías Industrias de la Escuela Técnica Superior de Ingeniería Industrial de Barcelona.
La minería de datos, conocida en inglés como data mining, es el proceso de búsqueda de información en grandes bases de datos por tal de identificar información o patrones que resulten útiles por tal de realizar predicciones futuras.
Durante todo el proceso se ha seguido la metodología CRISP-DM, la cual comprende las etapas necesarias para la realización de un estudio de data mining. Se han utilizado diferentes herramientas de software que trabajan con el lenguaje Python, como las librerías Pandas y Scikit Learn, y el IDE Spyder.
Las técnicas de regresión utilizadas han sido la regresión lineal, la regresión de cresta o ridge y el algoritmo K-Nearest Neighbors.
Las principales conclusiones que se extraen del estudio son que los resultados de las predicciones son muy pobres y que no existe una mejora sustancial de los resultados entre los diferentes algoritmos. Esto puede deberse a que la calidad de los datos no sea suficiente para modelarlos mediante regresión y poder hacer predicciones numéricas precisas. Finalmente, se proponen diferentes alternativas de trabajo para el futuro con la finalidad de continuar con el estudio.
DegreeGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Files | Description | Size | Format | View |
---|---|---|---|---|
anexos-tfg-asp.pdf | 623,7Kb | View/Open | ||
memoria-tfg-asp.pdf | 1,511Mb | View/Open |