Automatic speech recognition with Kaldi toolkit

Rosillo Gil, Victor

dc.contributor	Rodríguez Fonollosa, José Adrián
dc.contributor	Ziotko, Bartooz
dc.contributor.author	Rosillo Gil, Victor
dc.date.accessioned	2016-02-25T08:24:23Z
dc.date.available	2016-02-25T08:24:23Z
dc.date.issued	2016-02-08
dc.identifier.uri	http://hdl.handle.net/2117/83420
dc.description	Build a speech recognition system for a taxi booking application
dc.description.abstract	The topic of this thesis is to built an accurate automatic speech recognition system to be able to recognize speech using Kaldi, an open-source toolkit for speech recognition written in C++ and with free data. First of all, the main process of automatic speech recognition is explained in details on first steps. Secondly, different approaches of training and adaptation techniques are studied in order to improve the recognition accuracy. Furthermore, as data size is a very important point in order to achieve enough recognition accuracy, the role of it, is also studied on this thesis.
dc.description.abstract	El tema d'aquesta tesi tracta sobre la construcció d'un sistema de reconeixement automàtic de veu amb Kaldi, una eina de treball per a reconeixement de veu, escrita en C ++. Primer de tot, és explicat en detall tot el procés principal de reconeixement automàtic de veu. En segon lloc, diferents enfocs d'entrenament i adaptació són estudiats amb l'objectiu de millorar la precisió de reconeixement. Addicionalment, com la mida de les dades utilitzades és un factor molt important en l'entrenament i adaptació del sistema acústic per tal obtenir suficient qualitat de reconeixement, el seu paper és també estudiat.
dc.description.abstract	El tema de esta tesis trata sobre la construccion de un sistema de reconocimiento automático de voz usando Kaldi, una herramienta de trabajo para reconocimiento de voz, escrita en C++. Primero de todo, es explicado en detalles todo el proceso principal de reconocimiento automático de voz. En segundo lugar, diferentes enfoques de entrenamiento y adaptación son estudiados con el objetivo the mejorar la precisión de reconocimiento. Adicionalmente, como el tamaño de datos usados es un factor muy importante en el entrenamiento y adaptación para obtener suficiente calidad de reconocimiento, su papel es también estudiado.
dc.language.iso	eng
dc.publisher	Universitat Politècnica de Catalunya
dc.rights	S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject	Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic
dc.subject.lcsh	Automatic speech recognition
dc.subject.other	ASR
dc.subject.other	Kaldi
dc.subject.other	speaker adaptation
dc.subject.other	finite-state-transducers
dc.subject.other	Reconeixement automàtic de veu
dc.subject.other	Kaldi
dc.subject.other	transductors d'estat finits
dc.title	Automatic speech recognition with Kaldi toolkit
dc.title.alternative	Reconeixement automàtic de veu amb Kaldiw
dc.title.alternative	Reconocimiento automático de voz con Kaldi
dc.type	Bachelor thesis
dc.subject.lemac	Reconeixement automàtic de la parla
dc.identifier.slug	ETSETB-230.114888
dc.rights.access	Open Access
dc.date.updated	2016-02-25T06:50:41Z
dc.audience.educationlevel	Grau
dc.audience.mediator	Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degree	GRAU EN CIÈNCIES I TECNOLOGIES DE TELECOMUNICACIÓ (Pla 2010)
dc.contributor.covenantee	Akademia Górniczo-Hutnicza im. S. Staszica w Krakowie

Fitxers d'aquest items

Nom:: ASR with Kaldi toolkit MEMORY.pdf
Mida:: 810,2Kb
Format:: PDF

Visualitza/Obre

Aquest ítem apareix a les col·leccions següents

Grau en Ciències i Tecnologies de la Telecomunicació (Pla 2010) [186]

Mostra el registre d'ítem simple

UPCommons. Portal del coneixement obert de la UPC

Automatic speech recognition with Kaldi toolkit

Fitxers d'aquest items

Aquest ítem apareix a les col·leccions següents

Explora