The TALP & I2R SMT Systems for IWSLT 2008
Visualitza/Obre
Tipus de documentComunicació de congrés
Data publicació2008-10-31
EditorNICT/ATR
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
This paper gives a description of the statistical machine
translation (SMT) systems developed at the TALP Research
Center of the UPC (Universitat Polit`ecnica de Catalunya)
for our participation in the IWSLT’08 evaluation campaign.
We present Ngram-based (TALPtuples) and phrase-based
(TALPphrases) SMT systems. The paper explains the 2008
systems’ architecture and outlines translation schemes we
have used, mainly focusing on the new techniques that are
challenged to improve speech-to-speech translation quality.
The novelties we have introduced are: improved reordering
method, linear combination of translation and reordering
models and new technique dealing with punctuation marks
insertion for a phrase-based SMT system.
This year we focus on the Arabic-English, Chinese-Spanish and pivot Chinese-(English)-Spanish translation
tasks.
CitacióKhalilov, M. [et al.]. The TALP & I2R SMT Systems for IWSLT 2008. A: International Workshop on Spoken Language Translation. "International Workshop on Spoken Language Translation". Waikiki, Hawai: NICT/ATR, 2008, p. 116-123.
Versió de l'editorhttp://www.mt-archive.info/IWSLT-2008-Khalilov.pdf
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
IWSLT-2008-Khalilov.pdf | IWSLT-2008 | 235,2Kb | Visualitza/Obre |