Grammatical error correction for Spanish health records
Visualitza/Obre
Cita com:
hdl:2117/344914
Tipus de documentArticle
Data publicació2021-03
EditorSociedad Española para el Procesamiento del Lenguaje Natural
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
This paper describes the first approach to Grammatical Error Correction for Spanish health records. We present a series of experiments using neural networks and data augmentation, achieving 70.89 F0.5 score. Resources designed for this task are introduced, namely the IMEC corpus of corrected health records and the TMAE corpus of clinical texts augmented with errors. | Este artículo presenta el primer trabajo sobre la corrección gramatical de textos clínicos en español. En este trabajo, presentamos un conjunto de experimentos basados en redes neuronales y aumentación de datos, en los cuales conseguimos una puntuación de 70,89 F0,5. Además, se presentan dos corpus creados para esta tarea: el corpus IMEC, un corpus médico corregido manualmente, y el corpus TMAE, un corpus de textos clínicos aumentado con errores.
CitacióLima López, S.; Perez, N.; Cuadros, M. Grammatical error correction for Spanish health records. "Procesamiento del Lenguaje Natural", Març 2021, vol. 66, p. 121-132.
ISSN1135-5948
Versió de l'editorhttp://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6328
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
PLN_66_10.pdf | 921,9Kb | Visualitza/Obre |