Mostra el registre d'ítem simple

dc.contributorRodríguez Fonollosa, José Adrián
dc.contributorZiotko, Bartooz
dc.contributor.authorRosillo Gil, Victor
dc.date.accessioned2016-02-25T08:24:23Z
dc.date.available2016-02-25T08:24:23Z
dc.date.issued2016-02-08
dc.identifier.urihttp://hdl.handle.net/2117/83420
dc.descriptionBuild a speech recognition system for a taxi booking application
dc.description.abstractThe topic of this thesis is to built an accurate automatic speech recognition system to be able to recognize speech using Kaldi, an open-source toolkit for speech recognition written in C++ and with free data. First of all, the main process of automatic speech recognition is explained in details on first steps. Secondly, different approaches of training and adaptation techniques are studied in order to improve the recognition accuracy. Furthermore, as data size is a very important point in order to achieve enough recognition accuracy, the role of it, is also studied on this thesis.
dc.description.abstractEl tema d'aquesta tesi tracta sobre la construcció d'un sistema de reconeixement automàtic de veu amb Kaldi, una eina de treball per a reconeixement de veu, escrita en C ++. Primer de tot, és explicat en detall tot el procés principal de reconeixement automàtic de veu. En segon lloc, diferents enfocs d'entrenament i adaptació són estudiats amb l'objectiu de millorar la precisió de reconeixement. Addicionalment, com la mida de les dades utilitzades és un factor molt important en l'entrenament i adaptació del sistema acústic per tal obtenir suficient qualitat de reconeixement, el seu paper és també estudiat.
dc.description.abstractEl tema de esta tesis trata sobre la construccion de un sistema de reconocimiento automático de voz usando Kaldi, una herramienta de trabajo para reconocimiento de voz, escrita en C++. Primero de todo, es explicado en detalles todo el proceso principal de reconocimiento automático de voz. En segundo lugar, diferentes enfoques de entrenamiento y adaptación son estudiados con el objetivo the mejorar la precisión de reconocimiento. Adicionalmente, como el tamaño de datos usados es un factor muy importante en el entrenamiento y adaptación para obtener suficiente calidad de reconocimiento, su papel es también estudiado.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic
dc.subject.lcshAutomatic speech recognition
dc.subject.otherASR
dc.subject.otherKaldi
dc.subject.otherspeaker adaptation
dc.subject.otherfinite-state-transducers
dc.subject.otherReconeixement automàtic de veu
dc.subject.otherKaldi
dc.subject.othertransductors d'estat finits
dc.titleAutomatic speech recognition with Kaldi toolkit
dc.title.alternativeReconeixement automàtic de veu amb Kaldiw
dc.title.alternativeReconocimiento automático de voz con Kaldi
dc.typeBachelor thesis
dc.subject.lemacReconeixement automàtic de la parla
dc.identifier.slugETSETB-230.114888
dc.rights.accessOpen Access
dc.date.updated2016-02-25T06:50:41Z
dc.audience.educationlevelGrau
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeGRAU EN CIÈNCIES I TECNOLOGIES DE TELECOMUNICACIÓ (Pla 2010)
dc.contributor.covenanteeAkademia Górniczo-Hutnicza im. S. Staszica w Krakowie


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple