Mostra el registre d'ítem simple
Realtime data mining aplicado a la predicción de índices de bolsa incluyendo social media analytics
dc.contributor | Gibert, Karina |
dc.contributor.author | Fuentes Medina, Andrés Fernando |
dc.date.accessioned | 2017-12-17T10:22:31Z |
dc.date.available | 2017-12-17T10:22:31Z |
dc.date.issued | 2017-07-06 |
dc.identifier.uri | http://hdl.handle.net/2117/112197 |
dc.description.abstract | El presente trabajo tiene que ver con la obtención de modelos predictivos para la bolsa de valores que funcionen en intervalos cortos de tiempo. Además de trabajar con los precios que tienen las acciones en determinado instante, se incorporan los mensajes de la red social Twitter que tienen relación con dichas acciones y así verificar su impacto. Inicialmente se describe el estado del arte, los conceptos y herramientas utilizadas a lo largo del proyecto, ya que por su naturaleza interdisciplinar incorpora temas como el data mining, machine learning, sentiment analysis y computación distribuida. Se explica la metodología usada, que va desde la extracción de datos hasta la presentación y evaluación de resultados. Se distingue dos partes fundamentales: análisis con datos históricos y análisis con datos en tiempo real. Se describe para ambas partes el preprocesamiento de datos, ya que estos por ser de distinta naturaleza se les aplica criterios diferentes, entre los que se trata la reducción de dimensión y el sentiment analysis. Para la obtención de los modelos predictivos se aplican tres métodos distintos de machine learning, se compara y se evalúa los resultados para finalmente escoger los mejores. Con la información extraída en los pasos previos se lleva a cabo la implementación en tiempo real mediante Apache Spark, para hacer predicciones en tres intervalos distintos de tiempo. Tomando en cuenta las consideraciones de trabajar con un flujo constante de datos se describe una aplicación que optimiza el tiempo necesario para la evaluación de este tipo de modelos en ambiente de pruebas. Los resultados obtenidos se comparan con los de los modelos de datos históricos. El resultado final del proyecto es la descripción de la arquitectura e implementación de un sistema para evaluación de modelos predictivos de acciones bursátiles con datos en stream. Las conclusiones se enmarcan en la verificación de agregar información de redes sociales a los clásicos modelos predictivos que toman en cuenta solamente precios de acciones, así como también el hecho de trabajar con información en tiempo real. |
dc.language.iso | spa |
dc.publisher | Universitat Politècnica de Catalunya |
dc.subject | Àrees temàtiques de la UPC::Informàtica |
dc.subject.lcsh | Data mining |
dc.subject.lcsh | Machine learning |
dc.subject.other | sentiment analysis |
dc.subject.other | streaming |
dc.subject.other | spark |
dc.title | Realtime data mining aplicado a la predicción de índices de bolsa incluyendo social media analytics |
dc.type | Master thesis |
dc.subject.lemac | Mineria de dades |
dc.subject.lemac | Aprenentatge automàtic |
dc.identifier.slug | 126952 |
dc.rights.access | Open Access |
dc.date.updated | 2017-07-10T04:00:15Z |
dc.audience.educationlevel | Màster |
dc.audience.mediator | Facultat d'Informàtica de Barcelona |
dc.audience.degree | MÀSTER UNIVERSITARI EN ENGINYERIA INFORMÀTICA (Pla 2012) |