|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/16727
|
| Citació: | Marimon, M.; Padró, L. A hybrid approach to treebank construction. "Procesamiento del lenguaje natural", Setembre 2012, vol. 49, p. 139-146. |
| Títol: | A hybrid approach to treebank construction |
| Autor: | Marimon, Montserrat; Padró, Lluís  |
| Data: | set-2012 |
| Tipus de document: | Article |
| Resum: | Este artículo describe investigación sobre los efectos de la desambiguación morfosintáctica usada como un preproceso de un analizador sintáctico profundo basado en
HPSG, en el contexto del desarrollo de un treebank del español de código abierto, en el
entorno de DELPH-IN. La anotación treebank se realiza manualmente tomando las decisiones
apropiadas entre las opciones propuestas por el sistema y ordenadas por un módulo
estadístico. Los experimentos presentados muestran que el uso de un etiquetador reduce
la ambigüedad de las frases, y contribuye a limitar la cantidad de frases cuyo análisis sobrepasa el límite de tiempo, y ayuda a al módulo estadístico a clasificar el árbol correcto entre los mejores. Por un lado, nuestros resultados validan los beneficios ya reportados en la literatura de tal preproceso de análisis profundo con respecto a la velocidad, cobertura y precisión. Por otro lado, proponemos una estrategia basada en existentes herramientas de código abierto y recursos para desarrollar con alta consitencia treebanks de sintaxis profunda
para idiomas con limitada disponibilidad de recursos lingüísticos. |
| ISSN: | 1135-5948 |
| URI: | http://hdl.handle.net/2117/16727 |
| Versió de l'editor: | http://sinai.ujaen.es/sepln/ojs/ojs/index.php/pln/article/view/4550/2716 |
| Apareix a les col·leccions: | Departament de Llenguatges i Sistemes Informàtics. Articles de revista GPLN - Grup de Processament del Llenguatge Natural. Articles de revista Altres. Enviament des de DRAC
|
| Comparteix: |
|
Aquest ítem (excepte textos i imatges no creats per l'autor) està subjecte a una llicència de Creative Commons Llicència Creative Commons
|