Aprendizaje automático para la ciencia de datos
Tipus de documentTreball Final de Grau
Data2021-01-28
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
El projecte es basa en una branca específica de la ciència de dades: l’aprenentatge automàtic. Té com a propòsit dissenyar un algorisme predictiu per cada un dels quatre casos que s’exposen al document. S’utilitzen mètodes propis de l’aprenentatge automàtic i s’executa en Python. S’empra la regressió logística per predir la victòria o derrota d’un conjunt de partits de bàsquet, el clustering com a model predictiu no supervisat per agrupar en tres classes als soldats estatunidencs, els sistemes de recomanació per recomanar sèries de Netflix a persones desconegudes i, finalment, el processament del llenguatge natural per llegir títols de llibres i classificar-los per temàtica.
Es mesura també la precisió assolida de cada algorisme per comprovar la seva efectivitat. El proyecto se centra en una rama específica de la ciencia de datos: el aprendizaje automático. Tiene como propósito diseñar un algoritmo predictivo para cada uno de los cuatro casos que se exponen en el documento. Se utilizan métodos propios del aprendizaje automático y se ejecutan en Python. Se emplea la regresión logística para predecir la victoria o derrota de un conjunto de partidos de baloncesto, el clustering como modelo predictivo no supervisado para agrupar en tres clases a los soldados estadounidenses, los sistemas de recomendación para recomendar series de Netflix a personas desconocidas y, finalmente, el procesamiento del lenguaje natural para leer títulos de libros y clasificarlos por temática.
Se mide también la precisión alcanzada de cada algoritmo para comprobar su efectividad. The project focuses on a specific branch of data science: machine learning. Its purpose is to design a predictive algorithm for each of the four cases that are exposed in the document. Machine learning methods are used and run in Python. Logistic regression is used to predict the victory or defeat of a set of basketball games, clustering as an unsupervised predictive model to group US Army into three classes, recommendation systems to recommend Netflix series to unknown people and, finally, natural language processing to read book titles and classify them by subject.
The achieved precision of each algorithm is also measured to verify its effectiveness.
TitulacióGRAU EN ENGINYERIA ELÈCTRICA (Pla 2009)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Manzanera_Moreno_TFG.pdf | 1,985Mb | Visualitza/Obre | ||
Anexos.zip | 727,1Kb | application/zip | Visualitza/Obre |