Development and usability assessment of an attention-based encoder for analysing Type-2 Diabetes primary care from a large population
View/Open
Cita com:
hdl:2117/416271
Document typeBachelor thesis
Date2024-06-27
Rights accessOpen Access
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
This study examines the evolution of a time series spanning the years 2019, 2020, and 2021, utilizing multiple routinely collected health care data points for approximately 1.5 million adults in Catalonia. The aim is to create an Artificial Intelligence model capable of predicting events occurring in 2021 for each patient, based on training with data from 2019 and 2020. Although the prediction covers a wide range of variables related to diabetes such as hypertension or cardiovascular diseases, the primary focus is: predicting the use of medications related to blood glucose regulation such as insulin, predicting whether the result of glycated hemoglobin analysis falls within normal parameters (less than 7%) or is higher and predicting the likelihood of a patient being diagnosed with type 2 diabetes. The model has been developed starting from a model used in generation of synthetic data and then adapted to the specific needs of the dataset used. Given the inherent difficulty of the project, priority has been given to obtaining methodological results over achieving conclusive outcomes, as the model has not achieved the expected predictive capacity. Aquest treball estudia l'evolució d'una sèrie temporal dels anys 2019, 2020 i 2021 que recull múltiples dades relacionades amb el camp de la salut d'aproximadament 1.5 milions de persones majors d'edat a Catalunya. L'objectiu és crear un un model d'Intel·ligència Artificial capaç de predir els esdeveniments que han succeït l'any 2021 per a cada pacient, a partir de l'entrenament realitzat amb les dades dels anys 2019 i 2020. Tot i que la predicció cobreix una àmplia gamma de variables relacionades amb la diabetis, com ara hipertensió o malalties cardiovasculars, el focus principal és: predir l'ús de medicaments relacionats amb la regulació de la glucosa en sang, com la insulina, predir si el resultat de l'anàlisi de l'hemoglobina glicada cau dins dels paràmetres normals (menys del 7%) o és més alt, i predir la probabilitat que un pacient sigui diagnosticat amb diabetis tipus 2. El model s'ha desenvolupat a partir d'un model utilitzat en la generació de dades sintètiques i després s'ha adaptat a les necessitats específiques del conjunt de dades utilitzat. Donada la intrínseca dificultat del projecte, s'ha prioritzat l'obtenció de resultats metodològics sobre la consecució de resultats conclusius ja que el model no ha assolit la capacitat predictiva esperada.
SubjectsDiabetes, Supervised learning (Machine learning), Diabetis, Aprenentatge supervisat (Aprenentatge automàtic)
DegreeGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)
Files | Description | Size | Format | View |
---|---|---|---|---|
188149.pdf | 1,741Mb | View/Open |