|
|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/12676
|
| Citació: | Mariño, J. [et al.]. Overcoming statistical machine translation limitations: error analysis and proposed solutions for the Catalan–Spanish language pair. "Language resources and evaluation", 20 Febrer 2011, vol. 45, núm. 2, p. 181-208. |
| Títol: | Overcoming statistical machine translation limitations: error analysis and proposed solutions for the Catalan–Spanish language pair |
| Autor: | Mariño Acebal, José Bernardo  Farrús Cabeceran, Mireia  Ruiz Costa-Jussà, Marta  Poch, Marc Hernández Huerta, Adolfo  Herníquez, Carlos Rodríguez Fonollosa, José Adrián  |
| Data: | 20-feb-2011 |
| Tipus de document: | Article |
| Resum: | This work aims to improve anN-gram-based statistical machine translation
system between the Catalan and Spanish languages, trained with an aligned Spanish–
Catalan parallel corpus consisting of 1.7 million sentences taken from El Periódico newspaper. Starting from a linguistic error analysis above this baseline system,
orthographic, morphological, lexical, semantic and syntactic problems are approached
using a set of techniques. The proposed solutions include the development and application
of additional statistical techniques, text pre- and post-processing tasks, and rules
based on the use of grammatical categories, as well as lexical categorization. The
performance of the improved system is clearly increased, as is shown in both human and
automatic evaluations of the system, with a gain of about 1.1 points BLEU observed in
the Spanish-to-Catalan direction of translation, and a gain of about 0.5 points in the
reverse direction. The final system is freely available online as a linguistic resource |
| ISSN: | 1574-020X |
| URI: | http://hdl.handle.net/2117/12676 |
| Versió de l'editor: | 10.1007/s10579-011-9137-0 |
| Versió de l'editor: | http://dx.doi.org/10.1007/s10579-011-9137-0 |
| Apareix a les col·leccions: | Altres. Enviament des de DRAC Departament de Teoria del Senyal i Comunicacions. Articles de revista VEU - Grup de Tractament de la Parla. Articles de revista
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|