Feature classification by means of Deep Belief Networks for speaker recognition
Visualitza/Obre
Template (1) (1).pdf (227,2Kb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/84516
Tipus de documentText en actes de congrés
Data publicació2015
EditorInstitute of Electrical and Electronics Engineers (IEEE)
Condicions d'accésAccés restringit per política de l'editorial
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
In this paper, we propose to discriminatively model target
and impostor spectral features using Deep Belief Networks
(DBNs) for speaker recognition. In the feature level, the number
of impostor samples is considerably large compared to
previous works based on i-vectors. Therefore, those i-vector
based impostor selection algorithms are not computationally
practical. On the other hand, the number of samples for each
target speaker is different from one speaker to another which
makes the training process more difficult. In this work, we
take advantage of DBN unsupervised learning to train a global
model, which will be referred to as Universal DBN (UDBN).
Then we adapt this UDBN to the data of each target speaker.
The evaluation is performed on the core test condition of the
NIST SRE 2006 database and it is shown that the proposed
architecture achieves more than 8% relative improvement in
comparison to the conventional Multilayer Perceptron (MLP).
CitacióSafari, P., Ghahabi, O., Hernando, J. Feature classification by means of Deep Belief Networks for speaker recognition. A: European Signal Processing Conference. "23rd European Signal Processing Conference (EUSIPCO) took place 31 August - 4 September 2015 in Nice, France". Niza: Institute of Electrical and Electronics Engineers (IEEE), 2015, p. 2162-2166.
ISBN978-0-9928626-4-0
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Template (1) (1).pdf | 227,2Kb | Accés restringit |