Evaluation of the ALIZE / LIA_RAL Speaker Verification Toolkit on an Embedded System

Hernández López, Aitor

dc.contributor	Kaindl, Hermann
dc.contributor.author	Hernández López, Aitor
dc.contributor.other	Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned	2015-11-13T15:32:34Z
dc.date.available	2015-11-13T15:32:34Z
dc.date.issued	2015-02
dc.identifier.uri	http://hdl.handle.net/2117/79254
dc.description	La verificación de locutor independiente del texto es la acción de validar la identidad de un usuario usando únicamente características extraídas de su voz, sin tener en cuenta el texto pronunciado. Hoy en día, multitud de software de verificación de locutor ha sido implementado para funcionar en ordenadores personales, pero usar estas aplicaciones en sistemas embedidos (Smartphones, teléfonos, ordenadores integrados) multiplica su potencial en campos como la seguridad, el sector del automóvil u otras aplicaciones de entretenimiento. La comprensión teórica de los sistemas d
dc.description.abstract	Text-independent speaker verification is the computing task of verifying a user's claimed identity using only characteristics extracted from their voices, regardless of the spoken text. Nowadays, a lot of speaker verification applications are being implemented in software, and using these systems on embedded systems (PDAs, cell phones, integrated computers) multiplies their potential in security, automotive, or entertainment applications, among others. Comprehension of speaker verification requires a knowledge of voice processing and a high mathematical level. Embedded system performance is not the same as offered by a workstation. So, in-depth knowledge of the target platform where the system will be implemented and about cross-compilation tools necessary to adapt the software to the new platform is required, too. Also execution time and memory requirements have to be taken into account to get a good quality of speaker verification. In this thesis we evaluate the performance and viability of a speaker verification software on an embedded system. We present a comprehensive study of the toolkit and the target embedded system. The verification system used in this thesis is the ALIZE / LIA_RAL Toolkit. This software is able to recognize the identity of a client previously trained in a database, and works independently of the text spoken. We have tested the toolkit on a 32-bit RISC ARM architecture set computer. We expect the toolkit can be ported to comparable embedded system with a reasonable effort. The findings confirm that the speaker verification results on work station are comparable than in an embedded system. However, time and memory requirements are not the same in both platforms. Taking into account these results, we propose an optimization in the speaker verification test to reduce resource requirements.
dc.description.abstract	La verificación de locutor independiente del texto es la acción de validar la identidad de un usuario usando únicamente características extraídas de su voz, sin tener en cuenta el texto pronunciado. Hoy en día, multitud de software de verificación de locutor ha sido implementado para funcionar en ordenadores personales, pero usar estas aplicaciones en sistemas embedidos (Smartphones, teléfonos, ordenadores integrados) multiplica su potencial en campos como la seguridad, el sector del automóvil u otras aplicaciones de entretenimiento. La comprensión teórica de los sistemas de verificación de locutor requiere conocimientos de procesado de voz y un nivel alto de matemática algorítmica. El rendimiento de estos sistemas embedidos no es el mismo que los que ofrecen los ordenadores personales, así que hace falta un conocimiento exhaustivo de la plataforma en la cual se va a integrar la aplicación, así como un conocimiento de las herramientas de compilación cruzadas necesarias para adaptar el software a la nueva plataforma. Los requerimientos de tiempo y memoria también deben ser tenidos en cuenta para garantizar una buena calidad de verificación. En este proyecto, se evaluará el rendimiento y la viabilidad de un sistema de verificación de locutor integrado en un sistema embedido. Se presenta un estudio exhaustivo de las herramientas del software, así como de la plataforma de destino utilizada. El sistema de verificación usado en este proyecto ha sido la herramienta ALIZE / LIA_RAL. Este software es capaz de reconocer la identidad de un cliente entrenado con anterioridad y almacenado en una base de datos, y trabaja independientemente del texto pronunciado. El software ha sido testado en una máquina de pruebas con un procesador de 32-bit RISC ARM, pero el sistema podría ser portado a otros sistemas sin problemas añadidos . Los hallazgos durante el proyecto confirman que los resultados de la verificación en un sistema embedido son similares a los obtenidos en el PC. Sin embargo, los requerimientos de tiempo y memoria no son los mismos en las dos plataformas. Teniendo en cuenta estos resultados, se propone una optimización de los parámetros de configuración utilizados en el proceso de test para reducir considerablemente los recursos utilizados.
dc.description.abstract	La verificació de locutor independent del text és l'acció de validar la identitat d'un usuari usant únicament característiques extretes de la seva veu, sense tenir en compte el text pronunciat. Avui en dia, multitud de programes de verificació de locutor han estat implementats per funcionar en ordinadors personals, però usar aquestes aplicacions en sistemes integrats (Smartphones, telèfons, ordinadors integrats) multiplica el seu potencial en camps com la seguretat, el sector de l'automòbil o altres aplicacions d'entreteniment. La comprensió teòrica dels sistemes de verificació de locutor requereix coneixements de processament de veu i un nivell alt de matemàtica algorísmica. El rendiment d'aquests sistemes integrats no és el mateix que els que ofereixen els ordinadors personals, així que cal un coneixement exhaustiu de la plataforma en la qual es va a integrar l'aplicació, així com un coneixement de les eines de compilació creuades necessàries per adaptar el programari a la nova plataforma. Els requeriments de temps i memòria també s'han de tenir en compte per garantir una bona qualitat de verificació. En aquest projecte, s'avaluarà el rendiment i la viabilitat d'un sistema de verificació de locutor integrat en un sistema incrustat. Es presenta un estudi exhaustiu de les eines del programari, així com de la plataforma de destinació utilitzada. El sistema de verificació usat en aquest projecte ha estat l'eina ALIZE / LIA_RAL. Aquest programari és capaç de reconèixer la identitat d'un client entrenat amb anterioritat i emmagatzemat en una base de dades, i treballa independentment del text pronunciat. El programari ha estat testat en una màquina de proves amb un processador de 32 bits RISC ARM, però el sistema podria portar a altres sistemes sense problemes afegits Les troballes durant el projecte confirmen que els resultats de la verificació en un sistema integrat són similars als obtinguts al PC. No obstant això, els requeriments de temps i memòria no són els mateixos en les dues plataformes. Tenint en compte aquests resultats, es proposa una optimització dels paràmetres de configuració utilitzats en el procés de test per reduir considerablement els recursos utilitzats.
dc.language.iso	eng
dc.publisher	Universitat Politècnica de Catalunya
dc.rights	S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.subject	Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal
dc.subject.lcsh	Automatic speech recognition
dc.subject.lcsh	Compilers (Computer programs)
dc.subject.other	embedded systems
dc.subject.other	speaker recognition
dc.subject.other	voice processing
dc.subject.other	procesado de voz
dc.subject.other	reconocimiento de locutor
dc.subject.other	teoría del señal
dc.subject.other	sistemas embedidos
dc.subject.other	Processament digital del senyal -- PFC
dc.title	Evaluation of the ALIZE / LIA_RAL Speaker Verification Toolkit on an Embedded System
dc.type	Master thesis (pre-Bologna period)
dc.subject.lemac	Reconeixement automàtic de la parla
dc.subject.lemac	Compiladors (Programes d'ordinador)
dc.identifier.slug	ETSETB-230.112485
dc.rights.access	Open Access
dc.date.updated	2015-07-15T05:50:37Z
dc.audience.educationlevel	Estudis de primer/segon cicle
dc.audience.mediator	Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degree	ENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)

Fitxers d'aquest items

Nom:: MT_AitorHernandez_Memoria.pdf
Mida:: 6,951Mb
Format:: PDF

Visualitza/Obre

Aquest ítem apareix a les col·leccions següents

Enginyeria de Telecomunicació (Pla 1992) [1.590]

Mostra el registre d'ítem simple

UPCommons. Portal del coneixement obert de la UPC

Evaluation of the ALIZE / LIA_RAL Speaker Verification Toolkit on an Embedded System

Fitxers d'aquest items

Aquest ítem apareix a les col·leccions següents

Explora