Hurricane Seasonal Forecast Modelling
Visualitza/Obre
Declaracion_Sarmanto_Natalia.pdf (100,1Kb) (Accés restringit)
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/342980
Correu electrònic de l'autornatalia.sarmantogmail.com
Tipus de documentProjecte Final de Màster Oficial
Data2020-10
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
En aquesta tesi de màster, l’objectiu és crear un model de previsió estacional d’huracans basat en el millor model possible de la tècnica de Random Forest (RF) . Les dades obertes utilitzades són: Temperatura de la superfície marina global (SST), baixa temperatura estratosfèrica, oscil·lacions quasi-biennals, i, el nombre d’huracans en una temporada a la conca Atlàntica entre els anys 1978 i 2015. Seguim un enfocament basat en Data Science per tal de poder entendre el comportament de les variables que hem estudiat, utilitzant diverses tècniques de preprocessament de dades i tècniques de reducció de la dimensionalitat. Utilitzem un concepte innovador pel que fa a sèries temporals que ens permet introduir co-variables addicionals en l’anàlisi creant noves SST variables segons zones geogràfiques. Es comparen i avaluen dues bases de dades de SST són per així trobar la millor font de dades pels models creats. Utilitzem algoritmes d’aprenentatge automàtic per a la creació de diferents models que després seran avaluats. L’optimització d’híper-paràmetres s’utilitza per a modelar els algoritmes de la millor manera possible, on els resultats són verificats amb diferents mètriques d’avaluació . Finalment, s’avaluen els resultats dels models de RF contra els altres models creats amb altres tècniques d’aprenentatge automàtic. Els resultats mostren que els models de RF són els que prediuen amb més exactitud quan es redueixen dimensions usant tècniques d’anàlisi de components principals (PCA), mentre que deixem una porta oberta a futurs estudis sobre l’ús del model de gradient boosting. Els resultats mostren una nova manera d’entendre la relació entre aquestes variables i millora l’habilitat de predir huracans estacionalsen el futur El objetivo de esta tesis de máster es crear un modelo de previsión estacional de huracanes basado el mejor algoritmo posible de la técnica de Random Forest (RF). Los datos abiertos utilizados son: Temperatura de la superficie marina global (SST), baja temperatura estratosférica, oscilaciones casi-bienales y, el número de huracanes en una temporada en la cuenca Atlántica entre los años 1978 y 2015. Seguiremos un enfoque basado en Data Science para así poder entender el comportamiento de las variables estudiadas, utilizando diferentes técnicas de re-procesamiento de datos y técnicas de reducción de la dimensionalidad. Utilizamos un concepto innovador en series temporales que nos permite introducir co-variables adicionales en el análisis creando nuevas variables SST según zonas geográficas.Se comparan y evaluan dos bases de datos de SST para así encontrar la mejor fuente de datos posible para nuestros modelos. Utilizamos algoritmos de aprendizaje automático para la creación de diferentes modelos que después serán evaluados. La optimización de híper-parámetros se utiliza para modelar los algoritmos de la mejor manera posible, donde los resultados son verificados con distintas métricas de evaluación . Finalmente, testeamos los resultados de los modelos de RF contra los otros modelos creados usando técnicas de aprendizaje automático. Los resultados muestran que los modelos de RF son los que predicen con mayor exactitud cuándo se reducen dimensiones utilizando técnicas de análisis de componentes principales (PCA), mientras que dejamos una puerta abierta a futuros estudios sobre el método de gradient boosting. Los resultados muestran una nueva manera de entender la relación entre estas variables y mejora la habilidad de predecir huracanes estacionales en el futuro. In this master’s dissertation, the aim is to create a seasonal hurricane forecast model based on the best possible random forest technique. Open data on Global Sea Surface Temperature (SST), Lower Stratospheric Temperature, Quasi-biennial Oscillation and the number of hurricanes in a season in the Atlantic basin over the years of 1978-2015 are used and processed. A Data Science approach is followed to understand variable behaviour among the ones studied, using various pre-processing and dimension reduction techniques. An innovative concept in the field of time series is used to introduce additional covariables into the analysis by creating new SST variables according to geographical areas. Two SST databases are compared and tested to find the best data-source for the models built. Machine learning algorithms are used for the creation of different models, which are to be tested. Hyperparameter optimisation is studied for tuning the algorithms in the best possible way, where the results are verified with versatile evaluation metrics. Lastly, the random forest results are tested against models built on other machine learning algorithms. The results show that the tuned random forest algorithm gives the best prediction accuracy when dimensions are reduced using principal component analysis (PCA), whilst some further analysis is suggested to do on gradient boosting in future studies. Results offer a novel approach to understand the relationship between these variables and to improve the ability to predict seasonal hurricanes in the future.
TitulacióMÀSTER UNIVERSITARI EN CIÈNCIA I TECNOLOGIA DE LA SOSTENIBILITAT (Pla 2013)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
TFM_Sarmanto_Natalia_final.pdf | 9,379Mb | Visualitza/Obre | ||
Declaracion_Sarmanto_Natalia.pdf | 100,1Kb | Accés restringit |