Mostra el registre d'ítem simple
Automatic speech recognition with Kaldi toolkit
dc.contributor | Rodríguez Fonollosa, José Adrián |
dc.contributor | Ziotko, Bartooz |
dc.contributor.author | Rosillo Gil, Victor |
dc.date.accessioned | 2016-02-25T08:24:23Z |
dc.date.available | 2016-02-25T08:24:23Z |
dc.date.issued | 2016-02-08 |
dc.identifier.uri | http://hdl.handle.net/2117/83420 |
dc.description | Build a speech recognition system for a taxi booking application |
dc.description.abstract | The topic of this thesis is to built an accurate automatic speech recognition system to be able to recognize speech using Kaldi, an open-source toolkit for speech recognition written in C++ and with free data. First of all, the main process of automatic speech recognition is explained in details on first steps. Secondly, different approaches of training and adaptation techniques are studied in order to improve the recognition accuracy. Furthermore, as data size is a very important point in order to achieve enough recognition accuracy, the role of it, is also studied on this thesis. |
dc.description.abstract | El tema d'aquesta tesi tracta sobre la construcció d'un sistema de reconeixement automàtic de veu amb Kaldi, una eina de treball per a reconeixement de veu, escrita en C ++. Primer de tot, és explicat en detall tot el procés principal de reconeixement automàtic de veu. En segon lloc, diferents enfocs d'entrenament i adaptació són estudiats amb l'objectiu de millorar la precisió de reconeixement. Addicionalment, com la mida de les dades utilitzades és un factor molt important en l'entrenament i adaptació del sistema acústic per tal obtenir suficient qualitat de reconeixement, el seu paper és també estudiat. |
dc.description.abstract | El tema de esta tesis trata sobre la construccion de un sistema de reconocimiento automático de voz usando Kaldi, una herramienta de trabajo para reconocimiento de voz, escrita en C++. Primero de todo, es explicado en detalles todo el proceso principal de reconocimiento automático de voz. En segundo lugar, diferentes enfoques de entrenamiento y adaptación son estudiados con el objetivo the mejorar la precisión de reconocimiento. Adicionalmente, como el tamaño de datos usados es un factor muy importante en el entrenamiento y adaptación para obtener suficiente calidad de reconocimiento, su papel es también estudiado. |
dc.language.iso | eng |
dc.publisher | Universitat Politècnica de Catalunya |
dc.rights | S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada' |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
dc.subject | Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic |
dc.subject.lcsh | Automatic speech recognition |
dc.subject.other | ASR |
dc.subject.other | Kaldi |
dc.subject.other | speaker adaptation |
dc.subject.other | finite-state-transducers |
dc.subject.other | Reconeixement automàtic de veu |
dc.subject.other | Kaldi |
dc.subject.other | transductors d'estat finits |
dc.title | Automatic speech recognition with Kaldi toolkit |
dc.title.alternative | Reconeixement automàtic de veu amb Kaldiw |
dc.title.alternative | Reconocimiento automático de voz con Kaldi |
dc.type | Bachelor thesis |
dc.subject.lemac | Reconeixement automàtic de la parla |
dc.identifier.slug | ETSETB-230.114888 |
dc.rights.access | Open Access |
dc.date.updated | 2016-02-25T06:50:41Z |
dc.audience.educationlevel | Grau |
dc.audience.mediator | Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona |
dc.audience.degree | GRAU EN CIÈNCIES I TECNOLOGIES DE TELECOMUNICACIÓ (Pla 2010) |
dc.contributor.covenantee | Akademia Górniczo-Hutnicza im. S. Staszica w Krakowie |