Joint training of codebooks and acoustic models in automatic speech recognition using semi-continuous HMMs

Nogueiras Rodríguez, Albino; Caballero Galeote, Mónica; Mariño Acebal, José Bernardo

Visualitza/Obre

Article principal (340Kb) (Accés restringit) Sol·licita una còpia a l'autor

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Nogueiras Rodríguez, Albino

Caballero Galeote, Mónica

Mariño Acebal, José Bernardo

Tipus de documentComunicació de congrés

Data publicació2006

EditorEduardo Lleida Solano

Condicions d'accésAccés restringit per política de l'editorial

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

In this paper, three different techniques for building semicontinuousHMMbased speech recognisers are compared: the classical one, using Euclidean generated codebooks and independently trained acoustic models; jointly reestimating the codebooks and models obtained with the classical method; and jointly creating codebooks and models growing their size from one centroid to the desired number of them. The way this growth may be done is carefully addressed, focusing on the selection of the splitting direction and the way splitting is implemented. Results in a large vocabulary task show the ef ciency of the approach, with noticeable improvements both in accuracy and CPU consumption. Moreover, this scheme enables the use of the concatenation of features, avoiding the independence assumption usually needed in semi-continuous HMM modelling, and leading to further improvements in accuracy and CPU.

CitacióNogueiras, A.; Caballero, M.; Mariño, J. Joint training of codebooks and acoustic models in automatic speech recognition using semi-continuous HMMs. A: IV Jornadas en Tecnología del Habla. "IV Jornadas en Tecnología del Habla". Zaragoza: Eduardo Lleida Solano, 2006, p. 363-368.

URIhttp://hdl.handle.net/2117/16052

ISBN84-96214-82-6

Col·leccions

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
4jth_164.pdf	Article principal	340Kb	PDF	Accés restringit

UPCommons. Portal del coneixement obert de la UPC

Joint training of codebooks and acoustic models in automatic speech recognition using semi-continuous HMMs

Visualitza/Obre

Explora