Mostra el registre d'ítem simple

dc.contributor.authorIndia, Miquel
dc.contributor.authorVaras González, David
dc.contributor.authorVilaplana Besler, Verónica
dc.contributor.authorMorros Rubió, Josep Ramon
dc.contributor.authorHernando Pericás, Francisco Javier
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2016-03-18T11:59:25Z
dc.date.available2016-03-18T11:59:25Z
dc.date.issued2015
dc.identifier.citationIndia, M., Varas, D., Vilaplana, V., Morros, J.R., Hernando, J. UPC system for the 2015 MediaEval multimodal person discovery in broadcast TV task. A: MediaEval Multimedia Benchmark Workshop. "MediaEval 2015 Multimedia Benchmark Workshop". Wurzen: 2015.
dc.identifier.urihttp://hdl.handle.net/2117/84692
dc.description.abstractThis paper describes a system to identify people in broadcast TV shows in a purely unsupervised manner. The system outputs the identity of people that appear, talk and can be identified by using information appearing in the show (in our case, text with person names). Three types of monomodal technologies are used: speech diarization, video diarization and text detection / named entity recognition. These technologies are combined using a linear programming approach where some restrictions are imposed.
dc.language.isoeng
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic
dc.subjectÀrees temàtiques de la UPC::So, imatge i multimèdia::Creació multimèdia::Vídeo digital
dc.subject.lcshDigital television
dc.subject.lcshAutomatic speech recognition
dc.subject.lcshSpeech processing systems
dc.subject.lcshDigital video
dc.titleUPC system for the 2015 MediaEval multimodal person discovery in broadcast TV task
dc.typeConference report
dc.subject.lemacVídeo digital
dc.subject.lemacTelevisió digital
dc.subject.lemacReconeixement automàtic de la parla
dc.contributor.groupUniversitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo
dc.contributor.groupUniversitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
dc.relation.publisherversionhttp://ceur-ws.org/Vol-1436/
dc.rights.accessOpen Access
local.identifier.drac17532051
dc.description.versionPostprint (published version)
local.citation.authorIndia, M.; Varas, D.; Vilaplana, V.; Morros, J.R.; Hernando, J.
local.citation.contributorMediaEval Multimedia Benchmark Workshop
local.citation.pubplaceWurzen
local.citation.publicationNameMediaEval 2015 Multimedia Benchmark Workshop


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple