Mostra el registre d'ítem simple

dc.contributorHernando Pericás, Francisco Javier
dc.contributor.authorCasanovas Duch, Artemi
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2015-11-13T14:30:19Z
dc.date.available2015-11-13T14:30:19Z
dc.date.issued2015-10
dc.identifier.urihttp://hdl.handle.net/2117/79246
dc.descriptionImplementation of new discriminative techniques for the improvemente of the UPC speaker tracking system. Application to broadcast news applications.
dc.description.abstractVoice features fusion has been successfully used to both identify and verify speakers and to detect voice pathologies. Nowadays, it is also being tested in speaker diarization task. The following thesis shows a study on new long-term voice features for speaker diarization. Long-term features are fused among themselves at feature level and, then, they are also fused at score level with the traditional short-term voice features (MFCC). The experiments were carried out using a part of Agora database, achieving a relative improvement in the diarization error rate of 18.22 % compared with the results obtained with MFCC.
dc.description.abstractLa fusión de diferentes características de la voz se ha usado exitosamente tanto para identificar y verificar hablantes como para detectar patologías de la voz y, actualmente, se está probando en la tarea de diarización de hablantes. Este proyecto presenta un estudio sobre nuevas características de la voz a largo plazo para la diarización de hablantes. Primero, se fusionan las características a largo plazo entre ellas a nivel de características y, luego, se fusionan a nivel de puntuación con las características tradicionales de la voz a corto plazo (MFCC). Los experimentos planteados se han llevado a cabo sobre una parte de la base de datos Ágora, consiguiendo una mejora relativa en la tasa de error de diarización del 18.22 % respecto a los resultados obtenidos con los MFCC.
dc.description.abstractLa fusió de diferents característiques de la veu s’ha utilitzat exitosament tant per identificar i verificar parlants com per detectar patologies de la veu i, actualment, s’està provant en la tasca de diarització de parlants. Aquest projecte presenta un estudi sobre noves característiques de la veu a llarg termini per la diarització de parlants. Primer, es fusionen les característiques a llarg termini entre elles a nivell de característiques i, després, es fusionen a nivell de puntuació amb les característiques tradicionals de la veu a curt termini (MFCC). Els experiments s’han dut a terme sobre una part de la base de dades Àgora, aconseguint una millora relativa en la taxa d’error de diarització del 18.22% respecte els resultats obtinguts amb els MFCC.
dc.language.isocat
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshAutomatic speech recognition
dc.subject.otherspeaker diarization
dc.subject.otherprosody
dc.subject.otherGNE
dc.subject.otherLTAS
dc.subject.otherdiarización de hablantes
dc.subject.otherprosódia
dc.subject.otherGNE
dc.subject.otherLTAS
dc.subject.otherAnàlisi espectral -- PFC
dc.subject.otherBiometria -- PFC
dc.subject.otherÀudio -- PFC
dc.titleNoves característiques de veu per la diarització de parlants
dc.title.alternativeNew voice features for speaker diarization
dc.title.alternativeNuevas características de la voz para la diarización de hablantes
dc.typeBachelor thesis
dc.subject.lemacReconeixement automàtic de la parla
dc.identifier.slugETSETB-230.109794
dc.rights.accessOpen Access
dc.date.updated2015-11-04T06:52:03Z
dc.audience.educationlevelGrau
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeGRAU EN ENGINYERIA DE SISTEMES AUDIOVISUALS (Pla 2009)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple