Mostra el registre d'ítem simple

dc.contributorBiesialska, Magdalena
dc.contributorRuiz Costa-Jussà, Marta
dc.contributor.authorGuàrdia Fernàndez, Lluís
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Ciències de la Computació
dc.date.accessioned2022-01-20T18:07:59Z
dc.date.available2022-01-20T18:07:59Z
dc.date.issued2021-07-06
dc.identifier.urihttp://hdl.handle.net/2117/360304
dc.description.abstractLifelong learning is a technique defined as the ability to learn newor maintain older knowledge over time. This factor is very important for humans, as it is one of the keys to the ability to learn by humans, which artificial intelligence tries to replicate. Additionally, it supposes the possibility for the systems to adapt to new inputs without the necessity to train the models from scratch every time. This technique, although being already applied on autonomous agents or machine learning for computer vision, has not been evaluated in the field of Machine Translation (MT). In the case of MT, currently, the majority of processes are still using sets of static data or traditional techniques which force to train the model only once without taking into account the possible variation of the language in the context. This project will be carried out on the context of a system implemented on the BEAT platform and thought for the evaluation of a lifelong learning task, which uses two sets of data: one for training and the other to apply the learning without the translations, having a simulated person to whom we can request the translations for the sentences we think are necessary. The objective is to suggest and analyze the usage of an active learning technique: Quality Estimation (QE), and the following comparison with the results obtained using random selection. In this project, we work with the language pairs of English-French and English-German. As results with QEwe achieve a score of 26.7 and 15.9 points for EN-FR and EN-DE, respectively, using a penalizing n-grams precisions BLEU score. These means an improvement of 0,5 for ENFR and 0,7 for EN-DE over the results obtained using random selection. In conclusion, the usage of lifelong learning in machine translation is feasible, although still is in an initial phase. As future possible actions over QE would be interesting to make a more extensive search of parameters or using an adaptive QE model.
dc.description.abstractAprendizaje continuo es una técnica que se define como la habilidad de aprender nuevo conocimiento o mantener el ya obtenido previamente de forma continua en el tiempo. Este factor es muy importante por ser una de las claves en el aprendizaje humano el cual la inteligencia artificial intenta replicar. Además supone la posibilidad de los sistemas a adaptar-se a ciertos inputs nuevos sin la necesidad de entrenar los modelos desde cero cada vez. Esta técnica, aun ya estar aplicada en agentes autónomos o aprendizaje automático en visión por computador, no ha estado evaluada en el campo de Traducción Automática. En este caso, actualmente, en la mayoría de procesos se sigue usando conjuntos de dadas estáticas o técnicas tradicionales que obligan a entrenar una sola vez un modelo sin tener en cuenta la posible variación del lenguaje en el contexto. Así pues, este proyecto se llevará a cabo en el contexto de un sistema implementado en la plataforma BEAT y pensado para la evaluación de una tasca de aprendizaje continuo, en el cual se dispone de dos conjuntos de datos: uno para entrenamiento y uno para aplicar el aprendizaje sin las traducciones, disponiendo de una persona simulada a la cual le podemos solicitar las traducciones de las frases que creamos necesarias. El objetivo es proponer y analizar el uso de una técnica de aprendizaje activo: Estimación de Calidad (EC), i la comparación posterior con los resultados obtenidos delante el uso de una selección aleatoria de las frases a traducir. En este proyecto se trabaja con los pares de lenguajes de Ingles-Francés e Ingles-Alemán. Como resultados con EC hemos obtenido unos valores de 26.7 y 15.9 para EN-FR y EN-DE, respectivamente, usando una puntuación BLEU penalizadora con precisión n-gram. Esto supone una mejora de 0,5 puntos para EN-FR y 0,7 puntos para EN-DE sobre los resultados obtenidos con la selección aleatoria. En definitiva, el uso de aprendizaje continuo en traducción automático es factible, aunque aún se encuentra en una situación muy inicial. Como posibles acciones futuras para EC sería interesante hacer una cerca más extensiva de los parámetros o hacer uso de un modelo EC adaptativo.
dc.description.abstractL’aprenentatge continu és una tècnica que es defineix com l’habilitat d’aprendre nou coneixement o mantenir el ja obtingut prèviament de forma contínua en el temps. Aquest factor és molt important per ser una de les claus en l’aprenentatge humà que la intel·ligència artificial intenta replicar. A més, suposa la possibilitat dels sistemes a adaptar-se a certs inputs nous sense la necessitat d’entrenar el model des de zero cada vegada. Aquesta tècnica, tot i ja estar aplicada en agents autònoms o aprenentatge automàtic en visió per computador, encara falta d’estar avaluada en el camp de Traducció Automàtica. En aquest cas, actualment, en la majoria de processos se segueix fent servir conjunts de dates estàtiques o tècniques tradicionals que obliguen a entrenar una sola vegada el model sense tenir en compte la possible variació del llenguatge en el context. Així doncs, aquest projecte es durà a terme en el context d’un sistema implementat en la plataforma BEAT i pensat per l’avaluació d’una tasca d’aprenentatge continu, en el qual es disposa de dos conjunts de dades: una per entrenament i una per aplicar l’aprenentatge sense les traduccions, disposant d’una persona simulada a la qual li podem sol·licitar les traduccions de les frases que creiem necessàries. L’objectiu és proposar i analitzar l’ús de una tècnica d’aprenentatge actiu: Estimació de Qualitat (EQ), i la comparació posterior amb els resultats obtinguts davant l’ús d’una selecció aleatòria de les frases a traduir. En aquest projecte es treballa amb els parells de llenguatges d’Angles- Francès i Angles-Alemany. Com a resultats amb EQ hem obtingut uns valors de 26.7 i 15.9 per EN-FR i EN-DE, respectivament, fent servir una puntuació BLEU penalitzadora amb precisió n-gram. Això suposa una millora de 0,5 punts per EN-FR i 0,7 punts per EN-DE sobre els resultats obtinguts fent servir selecció aleatòria. En definitiva, l’ús d’aprenentatge continu en traducció automàtica és factible, tot i que encara està en una situació molt inicial. Com a possibles accions futures en EQ seria interessant fer una cerca més extensiva dels paràmetres o fer ús d’un model EQ adaptatiu.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.subjectÀrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshActive learning
dc.subject.lcshMachine translating
dc.subject.lcshDeep learning
dc.subject.otherlifelong learning
dc.subject.otherdeep learning
dc.subject.otherquality estimation
dc.subject.othermachine translation
dc.subject.otheractive learning
dc.titleExploring lifelong learning in neural machine translation
dc.typeMaster thesis
dc.subject.lemacAprenentatge actiu
dc.subject.lemacTraducció automàtica
dc.subject.lemacAprenentatge profund
dc.identifier.slugETSETB-230.158823
dc.rights.accessOpen Access
dc.date.updated2021-07-28T05:50:40Z
dc.audience.educationlevelMàster
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeMÀSTER UNIVERSITARI EN TECNOLOGIES AVANÇADES DE TELECOMUNICACIÓ (Pla 2019)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple