Aplicació de tècniques de mostreig per millorar el rendiment de models de predicció de resultats acadèmics
Cita com:
hdl:2117/185165
Document typeBachelor thesis
Date2020-02-06
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-NoDerivs 3.0 Spain
Abstract
El següent document tracta sobre l’aplicació de tècniques de mostreig per tant de millorar el rendiment dels models de predicció de l’aprovat o el suspès dels i les alumnes de l’Escola Industrial de Barcelona de les assignatures del tercer quadrimestre del Grau en Enginyeria en Tecnologies Industrials. Al llarg del treball s’empren eines que són configurades mitjançant el llenguatge de programació Python, en l’entorn d’Anaconda con a IDE. En concret s’ha utilitzat la llibreria de Pandas i la llibreria de Scikit-learn. Tot el procediment del treball gira entorn a la metodologia CRISP-DM, des de l’inici amb la preparació de les dades fins al final a la validació dels models. A partir dels resultats obtinguts, s’ha realitzat un contrast entre els resultats d’ambdós mètodes de predicció emprats, amb i sense oversampling. Finalment, la conclusió principal extreta del projecte és que les precisions de predicció són relativament baixes mitjançant l’ús de l’arbres de decisió, tant amb oversampling com sense. Això s’atribueix a que les dades que es disposen són poc representatives per tal de poder-ne obtenir una predicció.
SubjectsData mining, Management information systems, Statistical decision, Mineria de dades, Sistemes d'informació per a la gestió, Decisió, Presa de (Estadística), Estudiants universitaris -- Avaluació
DegreeGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Files | Description | Size | Format | View |
---|---|---|---|---|
mem-ria-tfg-cl-udia-figueras.pdf | 1,740Mb | View/Open | ||
annex-cl-udia-figueras.pdf | 941,4Kb | View/Open |