A hybrid approach to treebank construction
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/16727
Tipus de documentArticle
Data publicació2012-09
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
Este artículo describe investigación sobre los efectos de la desambiguación morfosintáctica usada como un preproceso de un analizador sintáctico profundo basado en
HPSG, en el contexto del desarrollo de un treebank del español de código abierto, en el
entorno de DELPH-IN. La anotación treebank se realiza manualmente tomando las decisiones
apropiadas entre las opciones propuestas por el sistema y ordenadas por un módulo
estadístico. Los experimentos presentados muestran que el uso de un etiquetador reduce
la ambigüedad de las frases, y contribuye a limitar la cantidad de frases cuyo análisis sobrepasa el límite de tiempo, y ayuda a al módulo estadístico a clasificar el árbol correcto entre los mejores. Por un lado, nuestros resultados validan los beneficios ya reportados en la literatura de tal preproceso de análisis profundo con respecto a la velocidad, cobertura y precisión. Por otro lado, proponemos una estrategia basada en existentes herramientas de código abierto y recursos para desarrollar con alta consitencia treebanks de sintaxis profunda
para idiomas con limitada disponibilidad de recursos lingüísticos.
CitacióMarimon, M.; Padró, L. A hybrid approach to treebank construction. "Procesamiento del lenguaje natural", Setembre 2012, vol. 49, p. 139-146.
ISSN1135-5948
Versió de l'editorhttp://sinai.ujaen.es/sepln/ojs/ojs/index.php/pln/article/view/4550/2716
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
HYBRID_APPROACH.pdf | 207,4Kb | Visualitza/Obre |