Mostra el registre d'ítem simple
Noves característiques de veu per la diarització de parlants
dc.contributor | Hernando Pericás, Francisco Javier |
dc.contributor.author | Casanovas Duch, Artemi |
dc.contributor.other | Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions |
dc.date.accessioned | 2015-11-13T14:30:19Z |
dc.date.available | 2015-11-13T14:30:19Z |
dc.date.issued | 2015-10 |
dc.identifier.uri | http://hdl.handle.net/2117/79246 |
dc.description | Implementation of new discriminative techniques for the improvemente of the UPC speaker tracking system. Application to broadcast news applications. |
dc.description.abstract | Voice features fusion has been successfully used to both identify and verify speakers and to detect voice pathologies. Nowadays, it is also being tested in speaker diarization task. The following thesis shows a study on new long-term voice features for speaker diarization. Long-term features are fused among themselves at feature level and, then, they are also fused at score level with the traditional short-term voice features (MFCC). The experiments were carried out using a part of Agora database, achieving a relative improvement in the diarization error rate of 18.22 % compared with the results obtained with MFCC. |
dc.description.abstract | La fusión de diferentes características de la voz se ha usado exitosamente tanto para identificar y verificar hablantes como para detectar patologías de la voz y, actualmente, se está probando en la tarea de diarización de hablantes. Este proyecto presenta un estudio sobre nuevas características de la voz a largo plazo para la diarización de hablantes. Primero, se fusionan las características a largo plazo entre ellas a nivel de características y, luego, se fusionan a nivel de puntuación con las características tradicionales de la voz a corto plazo (MFCC). Los experimentos planteados se han llevado a cabo sobre una parte de la base de datos Ágora, consiguiendo una mejora relativa en la tasa de error de diarización del 18.22 % respecto a los resultados obtenidos con los MFCC. |
dc.description.abstract | La fusió de diferents característiques de la veu s’ha utilitzat exitosament tant per identificar i verificar parlants com per detectar patologies de la veu i, actualment, s’està provant en la tasca de diarització de parlants. Aquest projecte presenta un estudi sobre noves característiques de la veu a llarg termini per la diarització de parlants. Primer, es fusionen les característiques a llarg termini entre elles a nivell de característiques i, després, es fusionen a nivell de puntuació amb les característiques tradicionals de la veu a curt termini (MFCC). Els experiments s’han dut a terme sobre una part de la base de dades Àgora, aconseguint una millora relativa en la taxa d’error de diarització del 18.22% respecte els resultats obtinguts amb els MFCC. |
dc.language.iso | cat |
dc.publisher | Universitat Politècnica de Catalunya |
dc.rights | S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada' |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
dc.subject | Àrees temàtiques de la UPC::Enginyeria de la telecomunicació |
dc.subject.lcsh | Automatic speech recognition |
dc.subject.other | speaker diarization |
dc.subject.other | prosody |
dc.subject.other | GNE |
dc.subject.other | LTAS |
dc.subject.other | diarización de hablantes |
dc.subject.other | prosódia |
dc.subject.other | GNE |
dc.subject.other | LTAS |
dc.subject.other | Anàlisi espectral -- PFC |
dc.subject.other | Biometria -- PFC |
dc.subject.other | Àudio -- PFC |
dc.title | Noves característiques de veu per la diarització de parlants |
dc.title.alternative | New voice features for speaker diarization |
dc.title.alternative | Nuevas características de la voz para la diarización de hablantes |
dc.type | Bachelor thesis |
dc.subject.lemac | Reconeixement automàtic de la parla |
dc.identifier.slug | ETSETB-230.109794 |
dc.rights.access | Open Access |
dc.date.updated | 2015-11-04T06:52:03Z |
dc.audience.educationlevel | Grau |
dc.audience.mediator | Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona |
dc.audience.degree | GRAU EN ENGINYERIA DE SISTEMES AUDIOVISUALS (Pla 2009) |