A fast one-pass-training feature selection technique for GMM-based acoustic event detection with audio-visual data
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/12069
Tipus de documentText en actes de congrés
Data publicació2010
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Acoustic event detection becomes a difficult task, even for a small number of events, in scenarios where events are produced rather spontaneously and often overlap in time. In
this work, we aim to improve the detection rate by means of feature selection. Using a one-against-all detection approach, a new fast one-pass-training algorithm, and an associated highly-precise metric are developed. Choosing a different subset of multimodal features for each acoustic event class, the results obtained from audiovisual data collected in the UPC multimodal room show an improvement in average detection rate with respect to using the whole set of features.
CitacióButko, T.; Nadeu Camprubí, C. A fast one-pass-training feature selection technique for GMM-based acoustic event detection with audio-visual data. A: Annual Conference of the International Speech Communication Association. "Proceedings of the 11th Annual Conference of the International Speech Communication Association (INTERSPEECH 2010)". 2010, p. 2338-2341. ISBN 1990-9772.
ISBN1990-9772
Versió de l'editorhttp://www.isca-speech.org/archive/interspeech_2010/i10_2338.html
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Interspeech2010_Taras_cameraready.pdf | Interspeech 2010 | 208,1Kb | Visualitza/Obre |