DSpace DSpace UPC
 Català   Castellano   English  

E-prints UPC >
Altres >
Enviament des de DRAC >

Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/2117/12676

Arxiu Descripció MidaFormat
Mireia2011_LRE.pdf387,11 kBAdobe PDFThumbnail
Veure/Obrir

Citació: Mariño, J. [et al.]. Overcoming statistical machine translation limitations: error analysis and proposed solutions for the Catalan–Spanish language pair. "Language resources and evaluation", 20 Febrer 2011, vol. 45, núm. 2, p. 181-208.
Títol: Overcoming statistical machine translation limitations: error analysis and proposed solutions for the Catalan–Spanish language pair
Autor: Mariño Acebal, José Bernardo Veure Producció científica UPC; Farrús Cabeceran, Mireia Veure Producció científica UPC; Ruiz Costa-Jussà, Marta Veure Producció científica UPC; Poch, Marc; Hernández Huerta, Adolfo Veure Producció científica UPC; Herníquez, Carlos; Rodríguez Fonollosa, José Adrián Veure Producció científica UPC
Data: 20-feb-2011
Tipus de document: Article
Resum: This work aims to improve anN-gram-based statistical machine translation system between the Catalan and Spanish languages, trained with an aligned Spanish– Catalan parallel corpus consisting of 1.7 million sentences taken from El Periódico newspaper. Starting from a linguistic error analysis above this baseline system, orthographic, morphological, lexical, semantic and syntactic problems are approached using a set of techniques. The proposed solutions include the development and application of additional statistical techniques, text pre- and post-processing tasks, and rules based on the use of grammatical categories, as well as lexical categorization. The performance of the improved system is clearly increased, as is shown in both human and automatic evaluations of the system, with a gain of about 1.1 points BLEU observed in the Spanish-to-Catalan direction of translation, and a gain of about 0.5 points in the reverse direction. The final system is freely available online as a linguistic resource
ISSN: 1574-020X
URI: http://hdl.handle.net/2117/12676
DOI: 10.1007/s10579-011-9137-0
Versió de l'editor: http://dx.doi.org/10.1007/s10579-011-9137-0
Apareix a les col·leccions:Altres. Enviament des de DRAC
VEU - Grup de Tractament de la Parla. Articles de revista
Departament de Teoria del Senyal i Comunicacions. Articles de revista
Comparteix:


Stats Mostra les estadístiques d'aquest ítem

SFX Query

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets.

Per a qualsevol ús que se'n vulgui fer no previst a la llei, dirigiu-vos a: sepi.bupc@upc.edu

 

Valid XHTML 1.0! Programari DSpace Copyright © 2002-2004 MIT and Hewlett-Packard Comentaris
Universitat Politècnica de Catalunya. Servei de Biblioteques, Publicacions i Arxius