Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua
Visualitza/Obre
10.5821/dissertation-2117-94252
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/94252
Càtedra / Departament / Institut
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
Tipus de documentTesi
Data de defensa1999-11-22
EditorUniversitat Politècnica de Catalunya
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
En esta tesis se aborda el entrenamiento discriminativo de unidades subléxicas utilizando bases de datos de propósito geneal. Las unidades subléxicas son la base de funcionamiento de los sistemas de reconocimiento de grandes vocabularios en habla continua, los cuales constituyen uno de los retos de máxima actualidad y la puerta de acceso a otras propuestas aún más ambiciosas como el dictado automático o los sistemas de diálogo.
Por su parte, el entrenamiento discriminativo ha demostrado ser una herramienta sumamente potente en el modelado acústico de sistemas de reconocimiento del habla. Su funcionamiento se basa en aumentar la probabilidad de que el sistema reconozca la frase correcta aplicando, más o menos, la misma regla de decisión empleada en condiciones reales de reconocimiento. Una limitación habitual de los sistemas de entrenamiento discriminativo propuestos hasta la fecha es la necesidad de bases de datos formadas por material específico de la tarea a reconocer.
En la primera parte de la tesis se presenta la propuesta propia de esta tesis para la aplicación de entrenamiento discriminativo a unidades subléxicas para su aplicación a tareas de reconocimiento del habla continua: el entrenamiento de mínima confusibilidad en segmentos acústicos de longitud limitada.
Se proponen dos variantes. En la primera, el conocimiento del lenguaje de la tarea a reconocer es aprovechado para minimizar el número de errores de posible comisión en la tarea, utilizando segmentos acústicos extraídos de una base de datos de propósito general. A continuación, esta misma idea se extiende al caso en que la tarea es desconocida,obteniéndose modelos acústicos de propósito general. Se muestran resultados experimentales en el reconocimiento de las cadenas de dígitos en inglés TIDIGITS utilizando modelos de fonema y semifonema entrenados con TIMIT.
Por su parte, el entrenamiento discriminativo ha demostrado ser una herramienta sumamente potente en el modelado acústico de sistemas de reconocimiento del habla. Su funcionamiento se basa en aumentar la probabilidad de que el sistema reconozca la frase correcta aplicando, más o menos, la misma regla de decisión empleada en condiciones reales de reconocimiento. Una limitación habitual de los sistemas de entrenamiento discriminativo propuestos hasta la fecha es la necesidad de bases de datos formadas por material específico de la tarea a reconocer.
En la primera parte de la tesis se presenta la propuesta propia de esta tesis para la aplicación de entrenamiento discriminativo a unidades subléxicas para su aplicación a tareas de reconocimiento del habla continua: el entrenamiento de mínima confusibilidad en segmentos acústicos de longitud limitada.
Se proponen dos variantes. En la primera, el conocimiento del lenguaje de la tarea a reconocer es aprovechado para minimizar el número de errores de posible comisión en la tarea, utilizando segmentos acústicos extraídos de una base de datos de propósito general. A continuación, esta misma idea se extiende al caso en que la tarea es desconocida,obteniéndose modelos acústicos de propósito general. Se muestran resultados experimentales en el reconocimiento de las cadenas de dígitos en inglés TIDIGITS utilizando modelos de fonema y semifonema entrenados con TIMIT.
CitacióNogueiras Rodríguez, A. Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua. Tesi doctoral, UPC, Departament de Teoria del Senyal i Comunicacions, 1999. ISBN 9788469271438. DOI 10.5821/dissertation-2117-94252. Disponible a: <http://hdl.handle.net/2117/94252>
Dipòsit legalB.45334-2009
ISBN9788469271438
Altres identificadorshttp://www.tdx.cat/TDX-0722109-100044
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
TANR.pdf | 2,494Mb | Visualitza/Obre |