Show simple item record

dc.contributorGiró Nieto, Xavier
dc.contributor.authorRoca, Sandra
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2019-01-17T09:18:08Z
dc.date.available2019-01-17T09:18:08Z
dc.date.issued2018-10
dc.identifier.urihttp://hdl.handle.net/2117/127018
dc.description.abstractEsta tesis explora diferentes maneras de implementar un sistema de bloques de Traducción de Voz con el propósito de generar grandes cantidades de datos para generar un gran corpus paralelo de voz. La primera tarea consiste en buscar y conseguir dominar herramientas adecuadas para implementar cada uno de los tres bloques que integran el sistema de traducción de voz: reconocimiento de voz, traducción y síntesis de voz. Experimentamos con algunas herramientas de Código abierto y conseguimos entrenar un sistema de reconocimiento de voz y una máquina de traducción neuronal. Posteriormente, los sometemos a test con el fin de evaluar su rendimiento. Como opción alternativa, usamos las soluciones de Computación en la nube (Cloud Computing) proporcionadas por Google Cloud para implementar los tres bloques secuenciales y elaboramos el sistema global con éxito. Finalmente, hacemos un estudio comparativo entre el desarrollo de software interno y la implementación Cloud Computing.
dc.description.abstractThis bachelor's thesis explores different ways of building a block-based Speech Translation system with the aim of generating huge amounts of parallel speech data. The first goal is to research and manage to run suitable tools to implement each one of the three blocks that integrates the Speech Translation system: Speech Recognition, Translation and Speech Synthesis. We experiment with some open-source toolkits and we manage to train a speech recognition system and a neural machine translation system. Then, we test them to evaluate their performance. As an alternative option, we use the cloud computing solutions provided by Google Cloud to implement the three sequential blocks and we successfully build the overall system. Finally, we make a comparative study between an in-house software development versus Cloud computing implementation.
dc.description.abstractAquesta tesi explora diferents maneres d'implementar un sistema de blocs de Traducció de Veu amb la finalitat de generar un gran corpus paral·lel de veu. La primera tasca consisteix en cercar i aconseguir dominar eines adequades per a implementar cada un dels tres blocs que integra el sistema de traducció de veu: reconeixement de veu, traducció, i síntesi de veu. Experimentem amb algunes eines de codi obert i aconseguim entrenar un sistema de reconeixement de veu i una màquina de traducció neuronal. Posteriorment, els sotmetem a test per tal d'avaluar el seu rendiment. Com a opció alternativa, utilitzem les solucions d'Informàtica en núvol (Cloud Computing) proporcionades per Google Cloud per a implementar els tres blocs seqüencials i elaborem el sistema global amb èxit. Finalment, fem un estudi comparatiu entre el desenvolupament de software intern i la implementació Cloud computing.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.lcshAutomatic speech recognition
dc.subject.lcshMachine translating
dc.subject.otherreconocimiento del habla
dc.subject.othersíntesi de voz
dc.subject.othertraducción de voz
dc.subject.otherspeech translation
dc.subject.otherspeech recognition
dc.subject.otherspeech sythesis
dc.subject.otherSintetitzadors de veu
dc.titleBlock-based Speech-to-Speech Translation
dc.title.alternativeImplementación de un sistema de Traducción de Voz
dc.title.alternativeImplementació d'un sistema de Traducció de Veu
dc.typeBachelor thesis
dc.subject.lemacReconeixement automàtic de la parla
dc.subject.lemacTraducció automàtica
dc.identifier.slugETSETB-230.135813
dc.rights.accessOpen Access
dc.date.updated2018-10-25T05:50:41Z
dc.audience.educationlevelGrau
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Except where otherwise noted, content on this work is licensed under a Creative Commons license: Attribution-NonCommercial-NoDerivs 3.0 Spain