Multilingual machine translation: Deep analysis of language-specific encoder-decoders
Visualitza/Obre
Cita com:
hdl:2117/368571
Tipus de documentArticle
Data publicació2022-04-25
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
State-of-the-art multilingual machine translation relies on a shared encoder-decoder. In this paper, we propose an alternative approach based on language-specific encoder-decoders, which can be easily extended to new languages by learning their corresponding modules. To establish a common interlingua representation, we simultaneously train N initial languages. Our experiments show that the proposed approach improves over the shared encoder-decoder for the initial languages and when adding new languages, without the need to retrain the remaining modules. All in all, our work closes the gap between shared and language-specific encoder-decoders, advancing toward modular multilingual machine translation systems that can be flexibly extended in lifelong learning settings.
CitacióEscolano, C.; Costa-jussà, M.R.; Fonollosa, J.A.R. Multilingual machine translation: Deep analysis of language-specific encoder-decoders. "Journal of artificial intelligence research", 25 Abril 2022, vol. 73, p. 1535-1552.
ISSN1076-9757
Versió de l'editorhttps://jair.org/index.php/jair/article/view/12699
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
12699-Article (PDF)-30405-1-10-20220425.pdf | 1,174Mb | Visualitza/Obre |