Automatic mapping of mentions of symptoms and complaints in clinical reports to ICPC-2
Títol de la revista
ISSN de la revista
Títol del volum
Autors
Correu electrònic de l'autor
Tutor / director
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data
Condicions d'accés
Llicència
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
Classifying medical reports and clinical mentions to different categories is very important. Instead of having a human text, we could just have a series of codes describing perfectly the text. Solutions to this problem already exist, but they usually use the Snomed-CT terminology, and there does not seem to be a solution for the ICPC-2 Primary Care terminology. We will develop classification models for this terminology, this classifier will take a clinical mention and return a list of possible ICPC-2 codes. To do this classification we will compute similarity and distance metrics between the clinical mentions and different definitions of the ICPC-2 codes, they will be applied at a character level and a word level. A combination of different models will also be tried, to see if the performance increase or not The predictions of ICPC-2 codes will be re-ordered by the use of the context of the clinical mentions. Finally, an evaluation and comparison with models using word embeddings will also be done, to see if a combination of our similarity based models and the embeddings models is worth trying.
Es muy importante clasificar los informes médicos y las menciones clínicas en diferentes categorías. En lugar de tener un texto humano, podŕıamos tener una serie de códigos que describan perfectamente el texto. Ya existen soluciones a este problema, pero suelen utilizar la terminología Snomed-CT, y no parece haber una solución para la terminología de atención primaria ICPC-2. Desarrollaremos modelos de clasificación para esta terminología, estos modelos de clasificación cogerán una mención clínica y devolverán una lista de posibles códigos ICPC-2. Para hacer esta clasificación calcularemos métricas de similitud y distancia entre las menciones clínicas y las diferentes definiciones de los códigos ICPC-2, se aplicarán a nivel de carácter y a nivel de palabra. También se probará una combinación de diferentes modelos, para ver si el rendimiento aumenta o no. Las predicciones de los códigos ICPC- 2 se reordenarán mediante el uso del contexto de las menciones clínicas. Finalmente, también se realizará una evaluación y comparación con modelos que utilizan word embeddings, para ver si vale la pena probar una combinación de nuestros modelos basados en similitudes y los modelos que usan word embeddings.



