Grammatical error correction for Spanish health records

Lima López, Salvador; Perez, Naiara; Cuadros, Montse

doi:10.26342/2021-66-10

Visualitza/Obre

PLN_66_10.pdf (921,9Kb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Lima López, Salvador

Perez, Naiara

Cuadros, Montse

Tipus de documentArticle

Data publicació2021-03

EditorSociedad Española para el Procesamiento del Lenguaje Natural

Condicions d'accésAccés obert

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

This paper describes the first approach to Grammatical Error Correction for Spanish health records. We present a series of experiments using neural networks and data augmentation, achieving 70.89 F0.5 score. Resources designed for this task are introduced, namely the IMEC corpus of corrected health records and the TMAE corpus of clinical texts augmented with errors. | Este artículo presenta el primer trabajo sobre la corrección gramatical de textos clínicos en español. En este trabajo, presentamos un conjunto de experimentos basados en redes neuronales y aumentación de datos, en los cuales conseguimos una puntuación de 70,89 F0,5. Además, se presentan dos corpus creados para esta tarea: el corpus IMEC, un corpus médico corregido manualmente, y el corpus TMAE, un corpus de textos clínicos aumentado con errores.

CitacióLima López, S.; Perez, N.; Cuadros, M. Grammatical error correction for Spanish health records. "Procesamiento del Lenguaje Natural", Març 2021, vol. 66, p. 121-132.

URIhttp://hdl.handle.net/2117/344914

DOI10.26342/2021-66-10

ISSN1135-5948

Versió de l'editorhttp://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6328

Col·leccions

Life Sciences - Articles de revista [374]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
PLN_66_10.pdf		921,9Kb	PDF	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Grammatical error correction for Spanish health records

Visualitza/Obre

Explora