Mostra el registre d'ítem simple

dc.contributorGiró Nieto, Xavier
dc.contributor.authorAssens Reina, Marc
dc.date.accessioned2017-11-03T13:29:13Z
dc.date.available2017-11-03T13:29:13Z
dc.date.issued2017
dc.identifier.urihttp://hdl.handle.net/2117/109755
dc.descriptionDetails of the project will be defined once the student is in Dublin.
dc.description.abstractThis thesis explores methodologies for scanpath prediction on images using deep learning frameworks. As a preliminary step, we analyze the characteristics of the data provided by different datasets. We then explore the use of Convolutional Neural Networks (CNN) and Long-Short-Term-Memory (LSTM) newtworks for scanpath prediction. We observe that these models fail due to the high stochastic nature of the data. With the gained insight, we propose a novel time-aware visual saliency representation named Saliency Volume, that averages scanpaths over multiple observers. Next, we explore the SalNet network and adapt it for saliency volume prediction, and we find several ways of generating scanpaths from saliency volumes. Finally, we fine-tuned our model for scanpaht prediction on 360-degree images and successfully submitted it to the Salient360! Challenge from ICME. The source code and models are publicly available at https://github.com/massens/saliency-360salient-2017.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshImage processing
dc.subject.lcshMachine learning
dc.subject.lcshNeural networks (Computer science)
dc.subject.otherDeep learning
dc.subject.othersaliency
dc.subject.othervisual attention
dc.subject.othersaliency model
dc.subject.otherneural network
dc.titleThe temporal dimension of visual attention models
dc.title.alternativeLa dimensión temporal de los modelos de atención visual
dc.title.alternativeLa dimensió temporal dels models d'atenció visual
dc.typeBachelor thesis
dc.subject.lemacImatges -- Processament
dc.subject.lemacAprenentatge automàtic
dc.subject.lemacXarxes neuronals (Informàtica)
dc.identifier.slugETSETB-230.126921
dc.rights.accessOpen Access
dc.date.updated2017-07-20T05:53:30Z
dc.audience.educationlevelGrau
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeGRAU EN CIÈNCIES I TECNOLOGIES DE TELECOMUNICACIÓ (Pla 2010)


Fitxers d'aquest items

Thumbnail
Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple