Mostra el registre d'ítem simple

dc.contributorFuhs, Mark
dc.contributor.authorBofill Pagès, David
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2014-10-22T13:17:07Z
dc.date.available2014-10-22T13:17:07Z
dc.date.issued2014-08
dc.identifier.urihttp://hdl.handle.net/2099.1/23254
dc.description.abstract[ANGLÈS] This work focuses on building and testing statistical language models based on recurrent neural networks. Although both speaker independent and dependent language models will be discussed and compared, this thesis makes emphasis on the speaker dependent scenario when building complete automatic speech recognition systems. Traditional techniques for estimating language models are based on N-gram counts and they basically remained the state-of-the-art for many applications. Recently, faster CPUs and efficient techniques made it possible to apply RNN-based language models to state-of-the-art systems efficiently. In this Thesis, you will see reductions in perplexity of RNN-based speaker dependent language models up to 25\% relative. The work was carried out at the Department of Speech Technology in M*Modal, Pittsburgh, PA, during the academic year 2013/2014.
dc.description.abstract[CASTELLÀ] Este trabajo se centra en el desarrollo de modelos de lenguaje estadísticos basados en redes neuronales recurrentes. Aunque los dos escenarios "speaker dependent" y "speaker independent" serán contemplados, discutidos y comparados, este proyecto de final de carrera se centra en el dependiente a la hora de desarrollar sistemas completos de reconocimiento de voz. Las técnicas tradicionales para estimar modelos de lenguaje son basadas en n-gramas, y básicamente han permanecido el estado del arte para muchas aplicaciones. Recientemente, con la mejora de rendimiento de las CPUs y con técnicas para reducir el tiempo de computación de las redes neuronales, ha sido posible aplicar modelos de lenguaje basados en RNNs a sistemas reales. En este trabajo, se verán reducciones de perplejidad de hasta el 25\% relativo cuando usamos este tipo de modelos de lenguaje. El trabajo se llevó a cabo en el departamento de tecnologías del habla en M*Modal, Pittsburgh, Pennsylvania, durante el año académico 2013/2014.
dc.description.abstract[CATALÀ] Aquest treball es centra en el desenvolupament de models de llenguatge estadístics basats en xarxes neuronals recurrents. Encara que ambdós escenaris "speaker dependent" i "speaker independent" seran contemplats i comparats, aquest projecte de final de carrera es centra en el dependent a l'hora de desenvolupar sistemes complets de reconeixement de veu. Les tècniques tradicionals per estimar models de llenguatge són basades en n-grames, i bàsicament s'han mantingut com a l'estat de l'art per moltes aplicacions. Recentment, amb la millora del rendiment de les CPUs i amb tècniques per reduir el temps de computació de les xarxes neuronals, ha estat possible aplicar models de llenguatge basats en RNNs a sistemes reals. En aquest treball, es veuran reduccions de perplexitat de fins al 25\% relatiu quan utilitzem aquest tipus de models de llenguatge. El treball es va dur a terme en el departament de tecnologies de la parla a M*Modal, Pittsburgh, Pennsylvania, durant l'any acadèmic 2013/2014.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshAutomatic speech recognition
dc.subject.lcshNeural networks (Computer science)
dc.subject.otherArtificial Intelligence
dc.subject.otherAutomatic Speech Recognition
dc.subject.otherNeural Networks
dc.subject.otherinteligencia artificial
dc.subject.otherredes neuronales
dc.subject.otherreconocimiento automático del habla
dc.subject.otherIntel·ligència artificial
dc.titleRecurrent Neural Networks for Speaker Dependent Language Modeling
dc.title.alternativeRedes Neuronales Recurrentes para el modelaje de lenguaje dependiente del locutor
dc.title.alternativeXarxes Neuronals Recurrents pel modelatge de llenguatge depenent del locutor
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacReconeixement automàtic de la parla
dc.subject.lemacXarxes neuronals (Informàtica)
dc.identifier.slugETSETB-230.94632
dc.rights.accessOpen Access
dc.date.updated2014-09-10T09:09:22Z
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple