Mostra el registre d'ítem simple

dc.contributorKaindl, Hermann
dc.contributor.authorHernández López, Aitor
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2015-11-13T15:32:34Z
dc.date.available2015-11-13T15:32:34Z
dc.date.issued2015-02
dc.identifier.urihttp://hdl.handle.net/2117/79254
dc.descriptionLa verificación de locutor independiente del texto es la acción de validar la identidad de un usuario usando únicamente características extraídas de su voz, sin tener en cuenta el texto pronunciado. Hoy en día, multitud de software de verificación de locutor ha sido implementado para funcionar en ordenadores personales, pero usar estas aplicaciones en sistemas embedidos (Smartphones, teléfonos, ordenadores integrados) multiplica su potencial en campos como la seguridad, el sector del automóvil u otras aplicaciones de entretenimiento. La comprensión teórica de los sistemas d
dc.description.abstractText-independent speaker verification is the computing task of verifying a user's claimed identity using only characteristics extracted from their voices, regardless of the spoken text. Nowadays, a lot of speaker verification applications are being implemented in software, and using these systems on embedded systems (PDAs, cell phones, integrated computers) multiplies their potential in security, automotive, or entertainment applications, among others. Comprehension of speaker verification requires a knowledge of voice processing and a high mathematical level. Embedded system performance is not the same as offered by a workstation. So, in-depth knowledge of the target platform where the system will be implemented and about cross-compilation tools necessary to adapt the software to the new platform is required, too. Also execution time and memory requirements have to be taken into account to get a good quality of speaker verification. In this thesis we evaluate the performance and viability of a speaker verification software on an embedded system. We present a comprehensive study of the toolkit and the target embedded system. The verification system used in this thesis is the ALIZE / LIA_RAL Toolkit. This software is able to recognize the identity of a client previously trained in a database, and works independently of the text spoken. We have tested the toolkit on a 32-bit RISC ARM architecture set computer. We expect the toolkit can be ported to comparable embedded system with a reasonable effort. The findings confirm that the speaker verification results on work station are comparable than in an embedded system. However, time and memory requirements are not the same in both platforms. Taking into account these results, we propose an optimization in the speaker verification test to reduce resource requirements.
dc.description.abstractLa verificación de locutor independiente del texto es la acción de validar la identidad de un usuario usando únicamente características extraídas de su voz, sin tener en cuenta el texto pronunciado. Hoy en día, multitud de software de verificación de locutor ha sido implementado para funcionar en ordenadores personales, pero usar estas aplicaciones en sistemas embedidos (Smartphones, teléfonos, ordenadores integrados) multiplica su potencial en campos como la seguridad, el sector del automóvil u otras aplicaciones de entretenimiento. La comprensión teórica de los sistemas de verificación de locutor requiere conocimientos de procesado de voz y un nivel alto de matemática algorítmica. El rendimiento de estos sistemas embedidos no es el mismo que los que ofrecen los ordenadores personales, así que hace falta un conocimiento exhaustivo de la plataforma en la cual se va a integrar la aplicación, así como un conocimiento de las herramientas de compilación cruzadas necesarias para adaptar el software a la nueva plataforma. Los requerimientos de tiempo y memoria también deben ser tenidos en cuenta para garantizar una buena calidad de verificación. En este proyecto, se evaluará el rendimiento y la viabilidad de un sistema de verificación de locutor integrado en un sistema embedido. Se presenta un estudio exhaustivo de las herramientas del software, así como de la plataforma de destino utilizada. El sistema de verificación usado en este proyecto ha sido la herramienta ALIZE / LIA_RAL. Este software es capaz de reconocer la identidad de un cliente entrenado con anterioridad y almacenado en una base de datos, y trabaja independientemente del texto pronunciado. El software ha sido testado en una máquina de pruebas con un procesador de 32-bit RISC ARM, pero el sistema podría ser portado a otros sistemas sin problemas añadidos . Los hallazgos durante el proyecto confirman que los resultados de la verificación en un sistema embedido son similares a los obtenidos en el PC. Sin embargo, los requerimientos de tiempo y memoria no son los mismos en las dos plataformas. Teniendo en cuenta estos resultados, se propone una optimización de los parámetros de configuración utilizados en el proceso de test para reducir considerablemente los recursos utilizados.
dc.description.abstractLa verificació de locutor independent del text és l'acció de validar la identitat d'un usuari usant únicament característiques extretes de la seva veu, sense tenir en compte el text pronunciat. Avui en dia, multitud de programes de verificació de locutor han estat implementats per funcionar en ordinadors personals, però usar aquestes aplicacions en sistemes integrats (Smartphones, telèfons, ordinadors integrats) multiplica el seu potencial en camps com la seguretat, el sector de l'automòbil o altres aplicacions d'entreteniment. La comprensió teòrica dels sistemes de verificació de locutor requereix coneixements de processament de veu i un nivell alt de matemàtica algorísmica. El rendiment d'aquests sistemes integrats no és el mateix que els que ofereixen els ordinadors personals, així que cal un coneixement exhaustiu de la plataforma en la qual es va a integrar l'aplicació, així com un coneixement de les eines de compilació creuades necessàries per adaptar el programari a la nova plataforma. Els requeriments de temps i memòria també s'han de tenir en compte per garantir una bona qualitat de verificació. En aquest projecte, s'avaluarà el rendiment i la viabilitat d'un sistema de verificació de locutor integrat en un sistema incrustat. Es presenta un estudi exhaustiu de les eines del programari, així com de la plataforma de destinació utilitzada. El sistema de verificació usat en aquest projecte ha estat l'eina ALIZE / LIA_RAL. Aquest programari és capaç de reconèixer la identitat d'un client entrenat amb anterioritat i emmagatzemat en una base de dades, i treballa independentment del text pronunciat. El programari ha estat testat en una màquina de proves amb un processador de 32 bits RISC ARM, però el sistema podria portar a altres sistemes sense problemes afegits Les troballes durant el projecte confirmen que els resultats de la verificació en un sistema integrat són similars als obtinguts al PC. No obstant això, els requeriments de temps i memòria no són els mateixos en les dues plataformes. Tenint en compte aquests resultats, es proposa una optimització dels paràmetres de configuració utilitzats en el procés de test per reduir considerablement els recursos utilitzats.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal
dc.subject.lcshAutomatic speech recognition
dc.subject.lcshCompilers (Computer programs)
dc.subject.otherembedded systems
dc.subject.otherspeaker recognition
dc.subject.othervoice processing
dc.subject.otherprocesado de voz
dc.subject.otherreconocimiento de locutor
dc.subject.otherteoría del señal
dc.subject.othersistemas embedidos
dc.subject.otherProcessament digital del senyal -- PFC
dc.titleEvaluation of the ALIZE / LIA_RAL Speaker Verification Toolkit on an Embedded System
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacReconeixement automàtic de la parla
dc.subject.lemacCompiladors (Programes d'ordinador)
dc.identifier.slugETSETB-230.112485
dc.rights.accessOpen Access
dc.date.updated2015-07-15T05:50:37Z
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple