|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/7514
|
| Citació: | Khalilov, M.; Fonollosa, José A. R. N-gram-based statistical machine translation versus syntax augmented machine translation: comparison and system combination. A: Association for Computational Linguistics. European Chapter. Conference. "12th Conference of the Europe Chapter of the Association for Computational Linguistics". 2009, p. 424-432. |
| Títol: | N-gram-based statistical machine translation versus syntax augmented machine translation: comparison and system combination |
| Autor: | Khalilov, Maxim ; Rodríguez Fonollosa, José Adrián  |
| Data: | 30-mar-2009 |
| Tipus de document: | Conference lecture |
| Resum: | In this paper we compare and contrast
two approaches to Machine Translation
(MT): the CMU-UKA Syntax Augmented
Machine Translation system (SAMT) and
UPC-TALP N-gram-based Statistical Machine
Translation (SMT). SAMT is a hierarchical
syntax-driven translation system
underlain by a phrase-based model and a
target part parse tree. In N-gram-based
SMT, the translation process is based on
bilingual units related to word-to-word
alignment and statistical modeling of the
bilingual context following a maximumentropy
framework. We provide a stepby-
step comparison of the systems and report
results in terms of automatic evaluation
metrics and required computational
resources for a smaller Arabic-to-English
translation task (1.5M tokens in the training
corpus). Human error analysis clarifies
advantages and disadvantages of the
systems under consideration. Finally, we
combine the output of both systems to
yield significant improvements in translation
quality. |
| URI: | http://hdl.handle.net/2117/7514 |
| Versió de l'editor: | http://www.aclweb.org/anthology-new/E/E09/E09-1049.pdf |
| Apareix a les col·leccions: | Altres. Enviament des de DRAC Departament de Teoria del Senyal i Comunicacions. Ponències/Comunicacions de congressos VEU - Grup de Tractament de la Parla. Ponències/Comunicacions de congressos
|
| Comparteix: |
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|