Interpretabilidad de las variables asociadas al infarto de miocardio con datos desequilibrados
View/Open
Cita com:
hdl:2117/385713
Document typeBachelor thesis
Date2023-02-02
Rights accessOpen Access
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
L’infart de miocardi és una de les causes principals de la mort d’homes i dones arreu del món.
Es dona lloc quan les artèries coronàries s’estrenyen, a causa d’un coàgul de sang i l’aterosclerosis,
llavors s’obstrueix totalment el pas de la sang al llarg de l’artèria amb la subsegüent manca de reg
i mort d’una zona del cor. Aproximadament un 30 % dels pacients que pateixen un infart moren
abans d’arribar a l’hospital, mentre que la mortalitat dins de l’hospital és menor, tot i que també és
elevada. Un dels aspectes més importants quan un pacient ingressa amb una IM és la decisió direc‐
ta sobre quin tractament és necessari realitzar‐li, ja que té un efecte directe en les probabilitats de
supervivència del pacient.
Aquest projecte utilitzarà una base de dades disponible sobre pacients amb diagnòstic d’infart
de miocardi, la qual ja ha estat imputada i equilibrada anteriorment per a diagnosticar la mortalitat
als pacients. L’objectiu final serà emprar aquestes dades imputades y balancejada, a les quals se’ls
aplicaran el model d’aprenentatge automàtic escollit, per així poder estudiar, analitzar i interpretar
el comportament de les variables utilitzades dins del model i relacionar la predicció amb les compli‐
cacions de l’infart de miocardi.
Aquesta tesi es pot considerar com el tancament a l’estudi de la predicció del IM, ja que en tre‐
balls anteriors [2] i [3] va ser estudiada la millor tècnica d’imputació i de balanceig per a aquestes
dades, les quals es troben detallades posteriorment. A més a més, es realitza una interpretació de
les variables més importants per a la predicció del IM.
L’estudi de les variables es realitza a partir d’una base de dades obtinguda per S.E. Golovenkin,
A.N. Gorban, E.M.Mirkes, V.A. Shulman, D.A. Rossiev, P.A. Shesternya, S.Yu. Nikulina, Yu.V. Orlova,
and M.G. Dorrer [1], on es descriuen els paràmetres clínics més característics de 1700 pacients du‐
rant el primer dia d’entrada a l’UCI, i un cop transcorregudes les primeres 24, 48 i 72 hores d’admissió
a l’hospital.
Un resultat precís i correcte d’aquest estudi serà molt crucial, ja que permetrà ajudar els metges
a poder predir un IM en un pacient una vegada s’hagi dut a terme l’estudi previ a l’entrada a la unitat
de cures intensives. El infarto de miocardio es una de las principales causas de la muerte de hombres y mujeres en
todo el mundo. Éste ocurre cuando las arterias coronarias se estrechan, debido a un coágulo de san‐
gre, la aterosclerosis, la cual obstruye totalmente el paso de sangre a lo largo de la arteria con la
subsiguiente falta de riego y muerte de una zona del corazón. Aproximadamente un 30 % de los pa‐
cientes con infarto fallece antes de llegar al hospital, mientras que la mortalidad dentro del hospital
es menor, pero también elevada. Uno de los aspectos más importantes cuando un paciente ingresa
con un infarto de miocardio es la decisión directa sobre qué tratamiento realizar, ya que va relacio‐
nado con la probabilidad de supervivencia del paciente.
Este proyecto utilizará una base de datos disponibles sobre pacientes con diagnóstico de Infarto
de miocardio, la cual ya ha sido imputada y equilibrada anteriormente. El objetivo final será em‐
plear estos datos imputados y balanceados a los que se le aplicarán el mejor modelo clasificador de
aprendizaje automático, para así estudiar, analizar e interpretar el comportamiento de las variables
utilizadas dentro del modelo de predicción y relacionar la predicción con las complicaciones del in‐
farto de miocardio.
Esta tesis se puede considerar como el cierre al estudio de la predicción del IM (“Infarto de mio‐
cardio”), puesto que en trabajos anteriores [2] y [3] se estudió la mejor técnica de imputación y de
balanceado para estos datos, los cuales se detallarán más adelante, y en esta además se realiza el
estudio del mejor modelo de predicción y la interpretación de las variables más importantes para la
predicción del IM.
El estudio de las variables se realizará a partir de una base de datos obtenida por S.E. Golo‐
venkin, A.N. Gorban, E.M.Mirkes, V.A. Shulman, D.A. Rossiev, P.A. Shesternya, S.Yu. Nikulina, Yu.V.
Orlova, and M.G. Dorrer [1], donde se describen los parámetros clínicos más característicos de 1700
pacientes, durante el primer día de entrada en la UCI y una vez transcurridas las primeras 24, 48 y
72 horas de admisión en el hospital.
Un resultado preciso y concreto de este estudio será muy importante ya que podrá ayudar a los
médicos a poder predecir un IM en un paciente una vez hayan hecho el estudio previo de entrada a
la unidad de cuidados intensivos. Myocardial infarction is one of the leading causes of death for men and women worldwide. It
occurs when the coronary arteries become narrowed, due to a blood clot and atherosclerosis, which
completely blocks the passage of blood along the artery with subsequent lack of blood supply and
death of an area of the heart. Approximately 30 percent of heart attack patients die before reaching
hospital, while in‐hospital mortality is lower, but also high. One of the most important aspects when
a patient is admitted with an MI is the direct decision on what treatment to give, as it is related to
the patient’s chance of survival.
This project will use an available database of patients with a diagnosis of myocardial infarction,
which has been previously imputed and balanced to diagnose patient mortality. The final objective
will be to use this imputed data to which the models used will be applied, in order to study, analyse
and interpret the behaviour of the variables used within the models and to relate the prediction to
the complications of myocardial infarction in an autonomous learning model.
This thesis can be considered as the closure to the study of MI prediction, since in previous works
[2] and [3] the best imputation and equilibrium technique for these data was studied, which will be
detailed later, and in this thesis an interpretation of the most important variables for the prediction
of MI is also carried out.
The study of the variables will be carried out on the basis of a database obtained by S.E. Golo‐
venkin, A.N. Gorban, E.M.Mirkes, V.A. Shulman, D.A. Rossiev, P.A. Shesternya, S.Yu. Nikulina, Yu.V.
Orlova, and M.G. Dorrer [1], describing the most characteristic clinical parameters of 1700 patients,
during the first day of admission to the ICU and after the first 24, 48 and 72 hours of admission to
the hospital.
A good result of this study will be very important as it may help clinicians to predict MI in a pa‐
tient once they have done a pre‐intensive care unit admission study.
SubjectsMachine learning, Heart -- Diseases -- Prevention, Aprenentatge automàtic, Cor -- Malalties -- Prevenció
DegreeGRAU EN ENGINYERIA BIOMÈDICA (Pla 2009)
Files | Description | Size | Format | View |
---|---|---|---|---|
TFG_Mariangeles_Ucda_Maza.pdf | 3,319Mb | View/Open |