N-gram-based statistical machine translation versus syntax augmented machine translation: comparison and system combination
Visualitza/Obre
Tipus de documentComunicació de congrés
Data publicació2009-03-30
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
In this paper we compare and contrast
two approaches to Machine Translation
(MT): the CMU-UKA Syntax Augmented
Machine Translation system (SAMT) and
UPC-TALP N-gram-based Statistical Machine
Translation (SMT). SAMT is a hierarchical
syntax-driven translation system
underlain by a phrase-based model and a
target part parse tree. In N-gram-based
SMT, the translation process is based on
bilingual units related to word-to-word
alignment and statistical modeling of the
bilingual context following a maximumentropy
framework. We provide a stepby-
step comparison of the systems and report
results in terms of automatic evaluation
metrics and required computational
resources for a smaller Arabic-to-English
translation task (1.5M tokens in the training
corpus). Human error analysis clarifies
advantages and disadvantages of the
systems under consideration. Finally, we
combine the output of both systems to
yield significant improvements in translation
quality.
CitacióKhalilov, M.; Fonollosa, José A. R. N-gram-based statistical machine translation versus syntax augmented machine translation: comparison and system combination. A: Association for Computational Linguistics. European Chapter. Conference. "12th Conference of the Europe Chapter of the Association for Computational Linguistics". 2009, p. 424-432.
Versió de l'editorhttp://www.aclweb.org/anthology-new/E/E09/E09-1049.pdf
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
E09-1049.pdf | EACL09 | 585,8Kb | Visualitza/Obre |