Movie success prediction using machine learning algorithms
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/334930
Tipus de documentProjecte Final de Màster Oficial
Data2020-07
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
In a fast-paced evolving world, everything is connected. Sooner than later, our most basic daily routines will be examined. Grocery and drug stores will keep track of all our purchases, smartphones will register how much we walk, run and bike a day and our headphones will keep track of the number of decibels we place our ears under. Despite sounding far-fetched and frankly, a bit scary, all the information collected can be used for our own benefit. There is no denying that the three types of data aforementioned can give us a valuable insight on our health, study possible hazards of our lifestyle and even contribute to finding possible diseases. All that is done through Machine Learning. The term Machine Learning (ML) was coined in 1959 by Arthur Samuel, an American IBMer and pioneer in the field of computer gaming and Artificial Intelligence (AI). Being nowadays on its prime, most experts define ML as the study of computer algorithms that improve automatically through experience. And don?t be fooled, by ?experience? they mean data. Machine Learning requires huge amounts of data on which to build their algorithms to later be able to predict uncertain outcomes. Actually, some experts even point out that the amount ? and quality ? of data available is far more important than the learning algorithm itself. This thesis studies several ML algorithms and uses them to successfully predict the revenue and rating of movies by means of a Kaggle movies dataset. Linear Regression (LR), Decision Trees (DT), Random Forests (RF) and some other algorithms will be discussed and their performance will be evaluated in terms of accuracy. En un mundo en constante cambio, todo está conectado. Tarde o temprano, los elementos más básicos de nuestra rutina diaria serán analizados. Los supermercados y las farmacias tendrán constancia de todo aquello que hemos comprado, nuestros teléfonos móviles registraran cuanto andamos, corremos y vamos en bici durante el día y nuestros auriculares detectaran a cuantos decibelios hemos sometido nuestros oídos. Pese a sonar surrealista y, francamente, una poco agobiante, toda esta información puede ser utilizada en nuestro beneficio. Es innegable que los tres tipos de datos previamente mencionados pueden proporcionarnos una valiosa información sobre nuestra salud, estudiar los posibles riesgos de nuestro estilo de vida o incluso contribuir a detectar posibles enfermedades. Todo esto se lleva a cabo mediante el Machine Learning. El término Machine Learning (ML) fue acuñado en 1959 por Arthur Samuel, un americano de IBM, pionero en el campo de los juegos de ordenador e Inteligencia Artificial (AI). Estando actualmente en pleno auge, la mayoría de expertos definen el ML como el estudio de algoritmos de ordenador que mejoran automáticamente mediante la experiencia. Y no os dejéis engañar, al decir 'experiencia' se refieren a datos. El Machine Learning requiere grandes cantidades de datos sobre los cuales construir los algoritmos que se encargan de predecir resultados inciertos. En realidad, algunos expertos aseguran que la cantidad ? y calidad ? de datos disponible es al menos igual de determinante que el algoritmo de aprendizaje en sí. Esta tesis estudia diversos algoritmos de ML y los utiliza para predecir de forma exitosa los ingresos y la valoración de películas mediante una base de datos de películas de Kaggle. Los algoritmos de Linear Regression (LR), Decision Trees (DT) y Random Forests (RF) entre otros son analizados y su rendimiento es comparado en términos de precisión. En un món en constant canvi, tot està connectat. Tard o d'hora, els elements més bàsics de la nostra rutina diària seràn analizats. Els mercats i les farmàcies tindràn constància de tot allò que hem comprat, els nostres telèfons mòbils registraran quant caminem, correm i anem en bici durant el dia i els nostres auriculars detectaran a quants decibels hem sotmès les nostres oïdes. Tot i sonar surrealista i, francament, una mica angoixant, tota aquesta informació pot ser utilitzada en el nostre benefici. És innegable que els tres tipus de dades previament esmentats poden proporcionar-nos una valuosa informació sobre la nostra salut, estudiar els possibles riscos del nostre estil de vida o inclús contribuïr a detectar possibles enfermetats. Tot això es duu a terme mitjançant el Machine Learning. El terme Machine Learning (ML) va ser encunyat el 1959 per Arthur Samuel, un Americà de IBM, pioner en el camp dels jocs d'ordinador i Intel·ligència Artificial (AI). Estant actualment en ple auge, la majoria d'experts defineixen el ML com l'estudi d'algoritmes d'ordinador que milloren automàticament mitjançant l'experiència. I no us deixeu enganyar, al dir 'experiència' es refereixen a dades. el Machine Learning requereix grans quantitats de dades sobre les quals desenvolupar els algoritmes que s'encarreguen de predir resultats incerts. En realitat, alguns experts asseguren que la quantitat ? i qualitat ? de dades disponible és com a mínim igual d'important que l'algoritme d'aprenentatge en sí. Aquesta tesi estudia diversos algoritmes de ML i els utilitza per predir de forma exitosa els ingressos i la valoració de pel·lícules mitjançant una base de dades de pel·lícules de Kaggle. Els algoritmes de Linear Regression (LR), Decision Trees (DT) i Random Forests (RF) entre d'altres son analizats i el seu rendiment és comparat en termes de precisió.
MatèriesMachine learning, Artificial intelligence, Aprenentatge automàtic, Intel·ligència artificial
TitulacióMÀSTER UNIVERSITARI EN ENGINYERIA DE TELECOMUNICACIÓ (Pla 2013)
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
TFM_Guille.pdf | 1,829Mb | Visualitza/Obre |