Machine Learning aplicat al Data Warehouse tradicional
Tipus de documentTreball Final de Grau
Data2020-05-12
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
Aquest treball sorgeix com a proposta de l’alumne a l’empresa en que es van realitzar les pràctiques curriculars. Es pretén realitzar una introducció i aplicació de les tècniques de Machine learning a la base de dades d’una empresa real amb l’objectiu final d’aconseguir resultats sobre un cas d’ús real (som capaços de predir si els clients de l’empresa tornaran a comprar productes de la companyia?). L’objectiu principal del treball es determinar fins a quin punt, una inversió mínima en un projecte desenvolupat a mode de prova de concepte permet a una empresa decidir si aquest tipus de tècniques d’anàlisi de dades suposen una inversió rentable. La metodologia a emprar començarà per comparar els pressupostos d’un projecte com seria aquest treball amb d’altres ofertes reals del mercat, s’analitzarà l’estat de l’art en tècniques de Machine learning per a aconseguir un nivell de formació suficient com per a elaborar un prototip de predictor que satisfaci l’objectiu del projecte, s’analitzarà les dades per escollir les variables que s’utilitzaran finalment, s’implementarà el predictor i se’n analitzaran els resultats. Per a poder realitzar l’anàlisi de comportament dels diferents models, es comparen els rendiments esperats per la definició intrínseca de cada algoritme en les diferents àrees que s’estudien de manera habitual en base al problema a resoldre tal i com s’explica al capítol 4. El model que s’ha utilitzat finalment s’anomena XGBoost, variant del model random forest que iterativament augmenta en complexitat per a la presa de decisions fins a un límit marcat pel desenvolupador (en aquest cas l’estudiant) per a evitar problemes d’overfitting (entrenar massa el model en el conjunt d’entrenament, fent-lo molt precís en aquest però erroni en el conjunt general). Finalment s’arriba a la conclusió que l’algoritme escollit ha arribat a proporcionar resultats amb un marge d’error acceptable i demostra el potencial que tenen les tècniques de Machine learning de cara a l’explotació de les dades a les empreses.
MatèriesMachine learning, Information storage and retrieval systems, Databases, Aprenentatge automàtic, Informació -- Sistemes d'emmagatzematge i recuperació, Bases de dades
TitulacióGRAU EN ENGINYERIA EN TECNOLOGIES INDUSTRIALS (Pla 2010)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
machine-learning-aplicat-al-dwh-tradicional.pdf | 1,313Mb | Visualitza/Obre | ||
annex-machine-learning.pdf | 305,6Kb | Visualitza/Obre |