Full-network embedding in a multimodal embedding pipeline
Fitxers
Títol de la revista
ISSN de la revista
Títol del volum
Col·laborador
Editor
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data publicació
Editor
Condicions d'accés
item.page.rightslicense
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
The current state-of-the-art for image annotation and image retrieval tasks is obtained through deep neural networks, which combine an image representation and a text representation into a shared embedding space. In this paper we evaluate the impact of using the Full-Network embedding in this setting, replacing the original image representation in a competitive multimodal embedding generation scheme. Unlike the one-layer image embeddings typically used by most approaches, the Full-Network embedding provides a multi-scale representation of images, which results in richer characterizations. To measure the influence of the Full-Network embedding, we evaluate its performance on three different datasets, and compare the results with the original multimodal embedding generation scheme when using a one-layer image embedding, and with the rest of the state-of-the-art. Results for image annotation and image retrieval tasks indicate that the Full-Network embedding is consistently superior to the one-layer embedding. These results motivate the integration of the Full-Network embedding on any multimodal embedding generation scheme, something feasible thanks to the flexibility of the approach
Descripció
Persones/entitats
Document relacionat
Versió de
Citació
Ajut
Forma part
DOI
Dipòsit legal
ISBN
ISSN
Versió de l'editor
Altres identificadors
Referències
Col·leccions
Departament de Ciències de la Computació - Ponències/Comunicacions de congressos
Computer Sciences - Ponències/Comunicacions de congressos
KEMLG - Grup d'Enginyeria del Coneixement i Aprenentatge Automàtic - Ponències/Comunicacions de congressos
CAP - Grup de Computació d'Altes Prestacions - Ponències/Comunicacions de congressos
Doctorat en Intel·ligència Artificial - Ponències/Comunicacions de congressos




