A multilingual corpus for rich audio-visual scene description in a meeting-room environment

Butko, Taras; Nadeu Camprubí, Climent; Moreno Bilbao, M. Asunción

Visualitza/Obre

Article (184,4Kb) (Accés restringit) Sol·licita una còpia a l'autor

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Butko, Taras

Nadeu Camprubí, Climent

Moreno Bilbao, M. Asunción

Tipus de documentText en actes de congrés

Data publicació2011

EditorACM Press. Association for Computing Machinery

Condicions d'accésAccés restringit per política de l'editorial

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

In this paper, we present a multilingual database specifically designed to develop technologies for rich audio-visual scene description in meeting-room environments. Part of that database includes the already existing CHIL audio-visual recordings, whose annotations have been extended. A relevant objective in the new recorded sessions was to include situations in which the semantic content can not be extracted from a single modality. The presented database, that includes five hours of rather spontaneously generated scientific presentations, was manually annotated using standard or previously reported annotation schemes, and will be publicly available for the research purposes.

CitacióButko, T.; Nadeu, C.; Moreno, M. A multilingual corpus for rich audio-visual scene description in a meeting-room environment. A: ICMI Workshop on Multimodal Corpora For Machine Learning. "ICMI Workshop on Multimodal Corpora for Machine Learning : Taking Stock and Roadmapping the Future". Alacant: ACM Press. Association for Computing Machinery, 2011, p. 1-6.

URIhttp://hdl.handle.net/2117/15467

Versió de l'editorhttp://embots.dfki.de/mmc/mmc11/Butkoetal.pdf

Col·leccions

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
ICMI_v11_published.pdf	Article	184,4Kb	PDF	Accés restringit

UPCommons. Portal del coneixement obert de la UPC

A multilingual corpus for rich audio-visual scene description in a meeting-room environment

Visualitza/Obre

Explora