Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua

Nogueiras Rodríguez, Albino

doi:10.5821/dissertation-2117-94252

Visualitza/Obre

TANR.pdf (2,494Mb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Nogueiras Rodríguez, Albino

Tutor / directorMariño Acebal, José Bernardo

Càtedra / Departament / Institut

Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions

Tipus de documentTesi

Data de defensa1999-11-22

EditorUniversitat Politècnica de Catalunya

Condicions d'accésAccés obert

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

En esta tesis se aborda el entrenamiento discriminativo de unidades subléxicas utilizando bases de datos de propósito geneal. Las unidades subléxicas son la base de funcionamiento de los sistemas de reconocimiento de grandes vocabularios en habla continua, los cuales constituyen uno de los retos de máxima actualidad y la puerta de acceso a otras propuestas aún más ambiciosas como el dictado automático o los sistemas de diálogo.

Por su parte, el entrenamiento discriminativo ha demostrado ser una herramienta sumamente potente en el modelado acústico de sistemas de reconocimiento del habla. Su funcionamiento se basa en aumentar la probabilidad de que el sistema reconozca la frase correcta aplicando, más o menos, la misma regla de decisión empleada en condiciones reales de reconocimiento. Una limitación habitual de los sistemas de entrenamiento discriminativo propuestos hasta la fecha es la necesidad de bases de datos formadas por material específico de la tarea a reconocer.

En la primera parte de la tesis se presenta la propuesta propia de esta tesis para la aplicación de entrenamiento discriminativo a unidades subléxicas para su aplicación a tareas de reconocimiento del habla continua: el entrenamiento de mínima confusibilidad en segmentos acústicos de longitud limitada.
Se proponen dos variantes. En la primera, el conocimiento del lenguaje de la tarea a reconocer es aprovechado para minimizar el número de errores de posible comisión en la tarea, utilizando segmentos acústicos extraídos de una base de datos de propósito general. A continuación, esta misma idea se extiende al caso en que la tarea es desconocida,obteniéndose modelos acústicos de propósito general. Se muestran resultados experimentales en el reconocimiento de las cadenas de dígitos en inglés TIDIGITS utilizando modelos de fonema y semifonema entrenados con TIMIT.

CitacióNogueiras Rodríguez, A. Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua. Tesi doctoral, UPC, Departament de Teoria del Senyal i Comunicacions, 1999. ISBN 9788469271438. DOI 10.5821/dissertation-2117-94252. Disponible a: <http://hdl.handle.net/2117/94252>

URIhttp://hdl.handle.net/2117/94252

DOI10.5821/dissertation-2117-94252

Dipòsit legalB.45334-2009

ISBN9788469271438

Altres identificadorshttp://www.tdx.cat/TDX-0722109-100044

Col·leccions

Tesis - Departament de Teoria del Senyal i Comunicacions [346]
Tesis - Totes les tesis [5.461]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
TANR.pdf		2,494Mb	PDF	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua

Visualitza/Obre

Explora