Mostra el registre d'ítem simple

dc.contributorNadeu Camprubí, Climent
dc.contributor.authorArcas Ruscalleda, Jordi
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2014-09-05T07:21:24Z
dc.date.available2014-09-05T07:21:24Z
dc.date.issued2014-07-23
dc.identifier.urihttp://hdl.handle.net/2099.1/22254
dc.description.abstract[ANGLÈS] In recent years the use of smartphones has been increasing among the society. Such devices allow the development of different applications which have a direct impact for the end user. Different systems of recognition are shown in this project to be implemented in mobile devices. Not only speech recognition is considered but also general sounds with different features rather than speech are taken into account. The study of how to process the signal is an important point in order to apply recognition. In particular, sounds are mainly affected by additive noise that affects the clean signal; for that reason one of the Final Project aims is to study enhanced algorithms for sound signals. In this study, noises present in common environment are applied in clean sounds with different levels of stationarity and SNR. The second step in our project is focused on signal recognition. The used methodology consists in analysing three well-known algorithms, DTW, GMM and HMM, when various type of sounds with different features are applied. In particular, a sound of mobile ringtone, bird songs and speech; simulating noisy environments that are added to the signal. One of the features of working on mobile phone is that these devices have less storage and processing capacity than dedicated servers. For this reason, data model size and computational cost are important aspects which are considered in this project.
dc.description.abstract[CASTELLÀ] En los últimos años se ha hecho notorio el uso de teléfonos inteligentes o smartphones para gran parte de la sociedad. Estos dispositivos abren un mundo de nuevas aplicaciones disponibles directamente para el usuario final. En este proyecto se implementan diversos sistemas de reconocimiento de sonido pensando en su utilización en dispositivos móviles. No sólo se considera la aplicación de reconocimiento de voz sino que se extiende el abanico a otros tipos de sonidos con características diferentes al habla. Es importante estudiar cómo procesar la señal que se analiza para posteriormente poder aplicar un reconocimiento. Concretamente, el sonido que se capta suele estar afectado por ruido interferente que distorsiona la señal; es por este motivo que es necesario el uso de algoritmos de mejora de señal. A los sonidos que se utilizan en este estudio se les añaden ruidos comunes a la mayoría de entornos, con diferentes grados de estacionariedad y de SNR. Posteriormente se pasa a reconocer la señal. En este proyecto se analiza el comportamiento de tres reconocedores ampliamente testeados en el pasado. En particular, se evalúan los reconocedores DTW, GMM y HMM cuando se aplican tres tipos de sonidos con características diferentes: el sonido de un timbre de teléfono móvil, el canto de pájaros y el habla; simulando entornos ruidosos que se añaden a las señales. Una de las características del entorno de trabajo en los dispositivos móviles es que disponen de una capacidad menor tanto de almacenamiento como de procesamiento si se compara con servidores dedicados. De esta manera, tanto el tamaño de los modelos que usan los reconocedores como el coste computacional del sistema empleado son aspectos de importancia que se consideran en este trabajo
dc.description.abstract[CATALÀ] En els darrers anys s’ha fet notori l’ús de telèfons intel·ligents o smartphones per gran part de la societat. Aquests dispositius obren un món de noves aplicacions disponibles directament per a l’usuari final. En aquest projecte s’implementen diversos sistemes de reconeixement de so pensant en la seva utilització en dispositius mòbils. No sols es considera l’aplicació de reconeixement de veu sinó que s’estén el ventall a altres tipus de sons amb característiques diferents a la parla. És important estudiar com processar el senyal que s’analitza per a posteriorment poder-hi aplicar un reconeixement. Concretament, el so que es capta sol estar afectat per soroll interferent que distorsiona el senyal; és per aquest motiu que és necessari l’ús d’algoritmes de millora de senyal. Als sons que s’utilitzen en aquest estudi se’ls afegeixen sorolls comuns a la majoria d’entorns, amb diferents graus d’estacionarietat i de SNR. Posteriorment es passa a reconèixer el senyal. En aquest projecte s’analitza el comportament de tres reconeixedors àmpliament testejats en el passat. En particular, s’avaluen els reconeixedors DTW, GMM i HMM quan s’apliquen a tres tipus de sons amb característiques diferents: el so d’un timbre de mòbil, el cant d’ocells i la parla; simulant entorns sorollosos que s’afegeixen als senyals. Una de les característiques de l’entorn de treball en els dispositius mòbils és que disposen d’una capacitat menor tant d’emmagatzematge com de processament si es compara amb servidors dedicats. D’aquesta manera, tant la mida dels models que usen els reconeixedors com el cost computacional del sistema emprat són aspectes d’importància que es consideren en aquest treball.
dc.language.isospa
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic
dc.subject.lcshAutomatic speech recognition
dc.subject.lcshElectromagnetic noise
dc.subject.lcshMobile computing
dc.subject.othersound
dc.subject.otherspeech
dc.subject.othermobile devices
dc.subject.othernoise
dc.subject.othersignal enhancement
dc.subject.otherrecognition
dc.subject.otherdispositivo móvil
dc.subject.othersonido
dc.subject.othervoz
dc.subject.otherreconocimiento
dc.subject.othermejora del señal
dc.subject.otherruido
dc.titleEstudi de detecció de sons en un entorn de dispositiu mòbil
dc.title.alternativeStudy of sound detection in a mobile device environment
dc.title.alternativeEstudio de detección de sonidos en un entorno de dispositivo móvil
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacReconeixement automàtic de la parla
dc.subject.lemacSoroll electromagnètic
dc.subject.lemacInformàtica mòbil
dc.identifier.slugETSETB-230.104136
dc.rights.accessOpen Access
dc.date.updated2014-08-01T05:50:42Z
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple