DSpace DSpace UPC
 Català   Castellano   English  

E-prints UPC >
Altres >
Enviament des de DRAC >

Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/2117/9466

Arxiu Descripció MidaFormat
AudiovisualHead.pdf2,16 MBAdobe PDFThumbnail
Veure/Obrir

Citació: Canton, C. [et al.]. Audiovisual head orientation estimation with particle filtering in multisensor scenarios. "Eurasip journal on advances in signal processing", Gener 2008, vol. 2008, p. 1-12.
Títol: Audiovisual head orientation estimation with particle filtering in multisensor scenarios
Autor: Canton Ferrer, Cristian Veure Producció científica UPC; Segura Perales, Carlos; Casas Pla, Josep Ramon Veure Producció científica UPC; Pardàs Feliu, Montse Veure Producció científica UPC; Hernando Pericás, Francisco Javier Veure Producció científica UPC
Data: gen-2008
Tipus de document: Article
Resum: This article presents a multimodal approach to head pose estimation of individuals in environments equipped with multiple cameras and microphones, such as SmartRooms or automatic video conferencing. Determining the individuals head orientation is the basis for many forms of more sophisticated interactions between humans and technical devices and can also be used for automatic sensor selection (camera, microphone) in communications or video surveillance systems. The use of particle filters as a unified framework for the estimation of the head orientation for both monomodal and multimodal cases is proposed. In video, we estimate head orientation from color information by exploiting spatial redundancy among cameras. Audio information is processed to estimate the direction of the voice produced by a speaker making use of the directivity characteristics of the head radiation pattern. Furthermore, two different particle filter multimodal information fusion schemes for combining the audio and video streams are analyzed in terms of accuracy and robustness. In the first one, fusion is performed at a decision level by combining each monomodal head pose estimation, while the second one uses a joint estimation system combining information at data level. Experimental results conducted over the CLEAR 2006 evaluation database are reported and the comparison of the proposed multimodal head pose estimation algorithms with the reference monomodal approaches proves the effectiveness of the proposed approach.
ISSN: 1687-6172
URI: http://hdl.handle.net/2117/9466
DOI: 10.1155/2008/276846
Versió de l'editor: http://www.hindawi.com/GetArticle.aspx?doi=10.1155/2008/276846
Apareix a les col·leccions:GPI - Grup de Processament d'Imatge i Vídeo. Articles de revista
VEU - Grup de Tractament de la Parla. Articles de revista
Departament de Teoria del Senyal i Comunicacions. Articles de revista
Altres. Enviament des de DRAC
Comparteix:


Stats Mostra les estadístiques d'aquest ítem

SFX Query

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets.

Per a qualsevol ús que se'n vulgui fer no previst a la llei, dirigiu-vos a: sepi.bupc@upc.edu

 

Valid XHTML 1.0! Programari DSpace Copyright © 2002-2004 MIT and Hewlett-Packard Comentaris
Universitat Politècnica de Catalunya. Servei de Biblioteques, Publicacions i Arxius