Automatic mapping of mentions of symptoms and complaints in clinical reports to ICPC-2

Carregant...
Miniatura
El pots comprar en digital a:
El pots comprar en paper a:

Projectes de recerca

Unitats organitzatives

Número de la revista

Títol de la revista

ISSN de la revista

Títol del volum

Cita com:

Correu electrònic de l'autor

Tribunal avaluador

Realitzat a/amb

Tipus de document

Treball Final de Grau

Condicions d'accés

Accés obert

Llicència

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització de la persona titular dels drets

Assignatures relacionades

Assignatures relacionades

Publicacions relacionades

Datasets relacionats

Datasets relacionats

Projecte CCD

Abstract

Classifying medical reports and clinical mentions to different categories is very important. Instead of having a human text, we could just have a series of codes describing perfectly the text. Solutions to this problem already exist, but they usually use the Snomed-CT terminology, and there does not seem to be a solution for the ICPC-2 Primary Care terminology. We will develop classification models for this terminology, this classifier will take a clinical mention and return a list of possible ICPC-2 codes. To do this classification we will compute similarity and distance metrics between the clinical mentions and different definitions of the ICPC-2 codes, they will be applied at a character level and a word level. A combination of different models will also be tried, to see if the performance increase or not The predictions of ICPC-2 codes will be re-ordered by the use of the context of the clinical mentions. Finally, an evaluation and comparison with models using word embeddings will also be done, to see if a combination of our similarity based models and the embeddings models is worth trying.


Es muy importante clasificar los informes médicos y las menciones clínicas en diferentes categorías. En lugar de tener un texto humano, podŕıamos tener una serie de códigos que describan perfectamente el texto. Ya existen soluciones a este problema, pero suelen utilizar la terminología Snomed-CT, y no parece haber una solución para la terminología de atención primaria ICPC-2. Desarrollaremos modelos de clasificación para esta terminología, estos modelos de clasificación cogerán una mención clínica y devolverán una lista de posibles códigos ICPC-2. Para hacer esta clasificación calcularemos métricas de similitud y distancia entre las menciones clínicas y las diferentes definiciones de los códigos ICPC-2, se aplicarán a nivel de carácter y a nivel de palabra. También se probará una combinación de diferentes modelos, para ver si el rendimiento aumenta o no. Las predicciones de los códigos ICPC- 2 se reordenarán mediante el uso del contexto de las menciones clínicas. Finalmente, también se realizará una evaluación y comparación con modelos que utilizan word embeddings, para ver si vale la pena probar una combinación de nuestros modelos basados en similitudes y los modelos que usan word embeddings.

Descripció

Provinença

Titulació

GRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)

Document relacionat

Citació

Ajut

DOI

Versió de l'editor

Altres identificadors

Referències