|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/16052
|
Ítem no disponible en accés obert per política de l'editorial
| Arxiu |
Descripció |
Mida | Format |
| 4jth_164.pdf | Article principal | 340 kB | Adobe PDF |  |
|
| Citació: | Nogueiras, A.; Caballero, M.; Mariño, J. Joint training of codebooks and acoustic models in automatic speech recognition using semi-continuous HMMs. A: IV Jornadas en Tecnología del Habla. "IV Jornadas en Tecnología del Habla". Zaragoza: Eduardo Lleida Solano, 2006, p. 363-368. |
| Títol: | Joint training of codebooks and acoustic models in automatic speech recognition using semi-continuous HMMs |
| Autor: | Nogueiras Rodríguez, Albino ; Caballero Galeote, Mónica ; Mariño Acebal, José Bernardo  |
| Editorial: | Eduardo Lleida Solano |
| Data: | 2006 |
| Tipus de document: | Conference lecture |
| Resum: | In this paper, three different techniques for building semicontinuousHMMbased
speech recognisers are compared:
the classical one, using Euclidean generated codebooks and independently trained acoustic models; jointly reestimating
the codebooks and models obtained with the classical method; and jointly creating codebooks and models growing their size from one centroid to the desired number
of them. The way this growth may be done is carefully addressed, focusing on the selection of the splitting direction and the way splitting is implemented. Results in a large vocabulary task show the ef ciency of the approach, with noticeable improvements both in accuracy and CPU consumption. Moreover, this scheme enables the use of the concatenation of features, avoiding the independence assumption usually needed in semi-continuous HMM modelling, and leading to further improvements in accuracy and CPU. |
| ISBN: | 84-96214-82-6 |
| URI: | http://hdl.handle.net/2117/16052 |
| Apareix a les col·leccions: | Departament de Teoria del Senyal i Comunicacions. Ponències/Comunicacions de congressos VEU - Grup de Tractament de la Parla. Ponències/Comunicacions de congressos Altres. Enviament des de DRAC
|
| Comparteix: |
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|