Estudio del rendimiento de técnicas de minería de datos en la predicción de resultados académicos

View/Open
Document typeBachelor thesis
Date2019-07-16
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-ShareAlike 3.0 Spain
Abstract
El presente documento pretende establecer una primera comparación de diferentes métodos de predicción, la comparación se realiza en base a los resultados que se obtienen con cada método a la hora de predecir si los alumnos de la escuela aprobarán o suspenderán, en su primer intento, las asignaturas pertenecientes al tercer cuatrimestre del grado (Q3). Los métodos que se emplean son la Regresión Logística, los Árboles de Decisión y los Support Vector Machine lineales. Para realizar este proyecto se sigue una famosa metodología empleada en proyectos de esta tipología, la metodología CRISP-DM, cada una de las etapas de dicha metodología está adaptada a este trabajo. La manipulación de datos, creación de modelos y obtención de resultados se realiza través del lenguaje de programación Python, destacando las librerías Pandas y SciKit-Learn. De los análisis de este trabajo se concluye que para la mayoría de las asignaturas del Q3, los dos grupos (aprobados y suspensos) no son separables linealmente entre sí y por esta razón los mejores resultados se obtienen de los Árboles de Decisión, a ello se le suma que en la mayoría de las asignaturas el número de aprobados es mucho mayor, y por ello, los resultados favorecen a este grupo. Los suspensos son predichos de forma acertada en más del 50%, únicamente para Electromagnetismo y Mecánica. En la sección de Trabajos Futuros de este proyecto se muestran algunos mecanismos que permitirían obtener mejores resultados para los métodos empleados y se sugieren posibles nuevos métodos.
DegreeGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Files | Description | Size | Format | View |
---|---|---|---|---|
tfg-memoria.pdf | 1,715Mb | View/Open |