Realtime data mining aplicado a la predicción de índices de bolsa incluyendo social media analytics
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/112197
Tipus de documentProjecte Final de Màster Oficial
Data2017-07-06
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
El presente trabajo tiene que ver con la obtención de modelos predictivos para la bolsa de valores que
funcionen en intervalos cortos de tiempo. Además de trabajar con los precios que tienen las acciones
en determinado instante, se incorporan los mensajes de la red social Twitter que tienen relación con
dichas acciones y así verificar su impacto. Inicialmente se describe el estado del arte, los conceptos y
herramientas utilizadas a lo largo del proyecto, ya que por su naturaleza interdisciplinar incorpora
temas como el data mining, machine learning, sentiment analysis y computación distribuida.
Se explica la metodología usada, que va desde la extracción de datos hasta la presentación y
evaluación de resultados. Se distingue dos partes fundamentales: análisis con datos históricos y
análisis con datos en tiempo real. Se describe para ambas partes el preprocesamiento de datos, ya que
estos por ser de distinta naturaleza se les aplica criterios diferentes, entre los que se trata la reducción
de dimensión y el sentiment analysis. Para la obtención de los modelos predictivos se aplican tres
métodos distintos de machine learning, se compara y se evalúa los resultados para finalmente escoger
los mejores.
Con la información extraída en los pasos previos se lleva a cabo la implementación en tiempo real
mediante Apache Spark, para hacer predicciones en tres intervalos distintos de tiempo. Tomando en
cuenta las consideraciones de trabajar con un flujo constante de datos se describe una aplicación que
optimiza el tiempo necesario para la evaluación de este tipo de modelos en ambiente de pruebas. Los
resultados obtenidos se comparan con los de los modelos de datos históricos.
El resultado final del proyecto es la descripción de la arquitectura e implementación de un sistema
para evaluación de modelos predictivos de acciones bursátiles con datos en stream. Las conclusiones
se enmarcan en la verificación de agregar información de redes sociales a los clásicos modelos
predictivos que toman en cuenta solamente precios de acciones, así como también el hecho de trabajar
con información en tiempo real.
TitulacióMÀSTER UNIVERSITARI EN ENGINYERIA INFORMÀTICA (Pla 2012)
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
126952.pdf | 517,9Kb | Visualitza/Obre |