Video object linguistic grounding
Visualitza/Obre
Publication (896,7Kb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Poster (1,631Mb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Slides (1,861Mb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Cita com:
hdl:2117/172234
Tipus de documentComunicació de congrés
Data publicació2019
EditorAssociation for Computing Machinery (ACM)
Condicions d'accésAccés restringit per política de l'editorial
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
The goal of this work is segmenting on a video sequence the objects which are mentioned in a linguistic description of the scene. We have adapted an existing deep neural network that achieves state of the art performance in semi-supervised video object segmentation, to add a linguistic branch that would generate an attention map over the video frames, making the segmentation of the objects temporally consistent along the sequence.
CitacióHerrera-Palacio, A.; Ventura, C.; Giro, X. Video object linguistic grounding. A: International Workshop on Multimodal Understanding and Learning for Embodied Applications. "MULEA '19 1st International Workshop on Multimodal Understanding and Learning for Embodied Applications Nice, France: October 25-25, 2019". New York: Association for Computing Machinery (ACM), 2019, p. 49-51.
ISBN978-1-4503-6918-3
Versió de l'editorhttps://dl.acm.org/citation.cfm?id=3357662
Altres identificadorshttps://imatge.upc.edu/web/publications/video-object-linguistic-grounding
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
paper.pdf | Publication | 896,7Kb | Accés restringit | |
poster.pdf | Poster | 1,631Mb | Accés restringit | |
slides.pdf | Slides | 1,861Mb | Accés restringit |