Correcting input noise in SMT as a char-based translation problem
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/18275
Tipus de documentReport de recerca
Data publicació2012-10-31
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
Misspelled words have a direct impact on the final quality obtained by Statistical Machine Translation (SMT) systems as the input becomes noisy and unpredictable. This paper presents some improvement strategies for translating real-life noisy input. The proposed strategies are based on a preprocessing step consisting in a character-based translator.
CitacióFormiga, L.; Fonollosa, José A. R. "Correcting input noise in SMT as a char-based translation problem". 2012.
Forma partTALP-2012-OCT-31
URL repositori externhttp://nlp.lsi.upc.edu/publications/papers/misspelling_techrep_oct2012.pdf
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
misspelling_techrep2012.pdf | Misspelling Technical Report | 350,5Kb | Visualitza/Obre |