Predicció de la demència tipus Alzheimer mitjançant xarxes neuronals a partir de dades cognitives
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/96557
Tipus de documentProjecte/Treball Final de Carrera
Data2016-09-21
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
Mild cognitive impairment (MCI) is considerate a transitional state between normal aging (NA) and some kind of dementia, in particular Alzheimer?s disease (AD). Artificial neural networks (ANNs) are a powerful machine learning tool that can provide valuable support to clinical decision making. The main goals of this study have been to find the ANN that best classify normal, MCI and AD subjects working with neuropsychological battery Neuronorma (NN). This battery consists of 33 neuropsychological tests that assess the basic range of cognitive abilities: attention, language, memory, executive function and visuospatial function. With the implemented ANN, a sensitivity analysis has been carried out in order to identify the most predictive features for a truthful diagnosis. To validate these results, the same group of subjects has been classified with a Linear Discriminant Classifier (LDC) and the results have been compared. The optimal ANN has been obtained by training neural networks with different settings. The first differential parameter has been the feature input vector dimension. In order to simplify the structures of neural networks and seek greater computational efficiency, three transformations have been done to the same input vectors (to the same study subjects): (1) standardization Neuronorma: transformation of raw scores to standard scores by age and education, scalar scores; (2) features reduction using the Principal Component Analysis (PCA) method; and, (3) features reduction using the Multiple Discriminant Analysis (MDA) method. The combination of applying or not these changes to the initial database has resulted in six new preprocessed databases to train and compare different ANNs: (1) raw scores database without reduction; (2) raw scores database with PCA reduction; (3) raw scores database with MDA reduction; (4) scalar scores database without reduction; (5) scalar scores database with PCA reduction; and (6) scalar scores database with MDA reduction. The second differential parameter has been the number of the hidden neurons. There have been six different experiments using the previous six preprocessed databases. In each experiment, neural networks have been trained with a different hidden number of neurons, from 1 to 35, and the neural network with the smallest validation error probability from each experiment has been chosen. This parameter indicates when the overfitting begins. Finally, it has been determined that the optimal neural network were those of the last six with the lower test error probability, and therefore the following 3 classes classify better: NA-MCI-AD. This optimal ANN has raw scores values as input vectors reduced by MDA algorithm and 8 hidden neurons, and classified with a probability of success of 94,87%. Moreover, the sensitivity analysis shows up that Free and Cued Selective Reminding Test (FCRST) and Rey-Osterrieth Complex Figure (ROCF) and education are the most significant and sensitive variables for classification. As a secondary objective, the same study has been done, with the same database entry, to classify two kinds of subjects paired as follows: NA-MCI, MCI-AD and NA-AD. In each case the optimal artificial neural network has been found, and the most predictive characteristics have been determined. The results have shown that the implementation of artificial neural network to classify two classes do not provide a significant improvement compared to those that classified three classes. To implement artificial neural networks, MatLab® programming language has been used. El deterioro cognitivo leve (DCL) se considera un estado transitorio entre el envejecimiento normal (EN) y diversas formas de demencia, en especial de la demencia tipo Alzheimer (DTA). Las redes neuronales artificiales (RNA) son una potente herramienta de aprendizaje que puede proporcionar al profesional un valioso soporte para la toma de decisiones clínicas. El objetivo principal de este trabajo ha sido encontrar la RNA que mejor clasifica sujetos con EN, DCL y DTA mediante datos neuropsicológicos de la batería Neuronorma (NN). Dicha batería está constituida por 33 test neuropsicológicos que evalúan el abanico básico de las capacidades cognitivas: atención, lenguaje, memoria, función ejecutiva y función visuoespacial. Con la RNA implementada se ha efectuado un análisis de sensibilidad para identificar las características más predictivas, y por tanto, con mayor peso en la decisión diagnóstica. Para validar todos estos resultados se ha clasificado el mismo grupo de sujetos con un Clasificador Discriminante Lineal (LDC) y se han comparado los resultados. La red neuronal artificial óptima se ha obtenido entrenando redes neuronales con diferentes parámetros de configuración. El primer parámetro diferencial ha sido la dimensión del vector de características de entrada. Con el fin de simplificar las estructuras de las redes neuronales y buscar una mayor eficiencia computacional, a los mismos vectores de entrada (mismos sujetos estudiados) se les han aplicado tres transformaciones: (1) normalización Neuronorma: transformación de las puntuaciones directas de los test, puntuaciones brutas, a puntuaciones normalizadas por edad y escolaridad, puntuaciones escalares; (2) reducción de características mediante el Análisis de Componentes Principales (PCA); y (3) reducción de características mediante el Análisis por Múltiples Discriminantes (MDA). La combinación de aplicar o no aplicar estas transformaciones a la base de datos inicial ha dado como resultado seis nuevas bases de datos preprocesadas para entrenar diferentes redes neuronales y compararlas: (1) base de datos de puntuaciones brutas sin reducción; (2) base de datos de puntuaciones brutas con reducción PCA; (3) base de datos de puntuaciones brutas con reducción MDA; (4) base de datos de puntuaciones escalares sin reducción; (5) base de datos de puntuaciones escalares con reducción PCA; y (6) base de datos de puntuaciones escalares con reducción MDA. El segundo parámetro diferencial ha sido el número de neuronas de la capa oculta. Se han realizado seis experimentos utilizando como vectores de entrada los de las seis bases de datos preprocesadas mencionadas. En cada experimento se han entrenado redes neuronales con diferentes números de neuronas en su capa oculta, desde 1 hasta 35, y se ha escogido de cada experimento la red neuronal que ha devuelto el error de validación menor. Este parámetro indica cuándo comienza el sobreaprendizaje. Finalmente se ha resuelto que la red neuronal óptima ha sido aquella de las seis escogidas con la probabilidad de error de test menor y, que por tanto, clasifica mejor las 3 clases: EN-DCL-DTA. Esta RNA óptima tiene como vectores de entrada valores de puntuaciones brutas reducidos mediante el algoritmo MDA y 8 neuronas en su capa oculta, y clasifica con una probabilidad de acierto del 94,87%. Por otro lado, el análisis de sensibilidad hecho con esta RNA ha determinado que los test de memoria Free and Cued Selective Reminding Test (FCRST) y Figura Compleja de Rey-Osterrieth (FCRO) son los más predictivos de la batería Neuronorma, y que la escolaridad tiene un gran peso en la clasificación. Como objetivo secundario, se ha efectuado el mismo estudio, con la misma base de datos de entrada, para clasificar, emparejadas de la siguiente forma: EN-DCL, DCL-DTA y EN-DTA. En cada caso se ha encontrado la red neuronal artificial óptima, y se han determinado las características más predictivas. Los resultados han demostrado que la implementación de una RNA para clasificar dos clases no aporta una mejora significativa respecto a la RNA que clasifica las tres. Para implementar las redes neuronales artificiales se ha utilizado el lenguaje de programación MatLab®. El deteriorament cognitiu lleu (DCL) és considera un estat transitori entre l’envelliment normal (EN) i diverses formes de demència, però en especial de la demència tipus Alzheimer (DTA). Les xarxes neuronals artificials (XNA) són una eina potent d’aprenentatge que pot proporcionar al professional un valuós suport per la presa de decisions clíniques diagnòstiques. L’objectiu principal d’aquest treball ha estat trobar la XNA que millor classifica subjectes amb EN, DCL i DTA mitjançant dades neuropsicològiques de la bateria Neuronorma (NN). Aquesta bateria està constituïda per 33 test neuropsicològics que avaluen el ventall bàsic de les capacitats cognitives: atenció, llenguatge, memòria, funció executiva i funció visuoespacial. Amb la XNA obtinguda s’ha fet una anàlisi de sensibilitat per tal d'identificar les característiques més predictives, és a dir, que tindran més pes en la decisió diagnòstica. Per validar tots aquests resultats s’ha classificat el mateix grup de subjectes amb un Classificador Discriminant Lineal (Linear Discriminant Classifier [LDC]) i s’han comparat els resultats. La XNA òptima s’ha obtingut entrenant xarxes neuronals amb diferents paràmetres de configuració. El primer paràmetre diferencial ha estat la dimensió del vector de característiques d’entrada. A fi de simplificar les estructures de les XNA i buscar una major eficiència computacional, als mateixos vectors d’entrada (mateixos subjectes estudiats) se’ls han fet tres transformacions: (1) normalització Neuronorma: transformació de les puntuacions directes dels test, puntuacions brutes, a puntuacions normalitzades per edat i escolaritat, puntuacions escalars; (2) reducció de característiques mitjançant l’anàlisi de Components Principals (Principal Component Analysis [PCA]); i (3) reducció de característiques mitjançant l’anàlisi per Múltiples Discriminats (Multilinear Discriminant Analysis [MDA]). El fet d’aplicar o no aquestes transformacions a la base de dades inicial han donat com a resultat sis noves bases de dades preprocessades per entrenar diferents xarxes neuronals i comparar-les: (1) base de dades de puntuacions brutes sense reducció; (2) base de dades de puntuacions brutes amb reducció PCA; (3) base de dades de puntuacions brutes amb reducció MDA; (4) base de dades de puntuacions escalars sense reducció; (5) base de dades de puntuacions escalars amb reducció PCA; i (6) base de dades de puntuacions escalars amb reducció MDA. El segon paràmetre diferencial ha estat el número de neurones de la capa oculta. S’han fet sis experiments utilitzant com a vectors d’entrada els de les sis bases de dades preprocessades esmentades. A cada experiment s’han entrenat xarxes neuronals amb diferents números de neurones en la seva capa oculta, des d?1 fins a 35, i s’ha escollit de cada experiment la xarxa neuronal que ha retornat la probabilitat d’error de validació menor. Aquest paràmetre indica quan comença el sobreaprenentatge. Finalment s’ha resolt que la xarxa neuronal òptima ha estat aquella de les sis escollides amb la probabilitat de error de test més petita i, que per tant, classifica millor les 3 classes: EN-DCL-DTA. Aquesta XNA òptima té com a vectors d’entrada valors amb puntuacions brutes reduïdes amb l’algorisme MDA i 8 neurones en la seva capa oculta, i classifica amb una probabilitat d’encert del 94,87%. Per altra banda, l’anàlisi de sensibilitat feta amb aquesta XNA ha determinat que els test de memòria Free and Cued Selective Reminding Test (FCRST) i Figura Complexa de Rey-Osterrieth (FCRO) són els més predictius de la bateria neuropsicològica Neuronorma, i que l’escolaritat té un gran pes en la classificació. Com objectiu secundari, s’ha fet el mateix estudi, amb la mateixa base de dades d’entrada, per a dues classes, emparellades de la següent manera: EN-DCL, DCL-DTA i EN-DTA. En cada cas s’ha trobat la XNA òptima, i s’han determinat les característiques més predictives. Els resultats han demostrat que la implementació d’una XNA per a classificar dues classes no aporta una millora significativa respecte a la XNA que classifica les tres. Per implementar les XNA s’ha utilitzat el llenguatge de programació MatLab® .
Descripció
Treball realitzat en col·laboració amb l'Institut Hospital del Mar d’Investigacions Mèdiques (IMIM) i el Departament de Psiquiatria i Medicina Legal de la Universitat Autònoma de Barcelona
MatèriesDatabases, Prediction theory, Neural networks (Computer science), Bases de dades, Predicció, Teoria de la, Xarxes neuronals (Informàtica)
TitulacióENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
NeusRiveraPFC92.pdf | 24,59Mb | Visualitza/Obre |