Show simple item record

dc.contributorGiró Nieto, Xavier
dc.contributorMcGuinness, Kevin
dc.contributor.authorReyes Rodriguez, Cristian
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2017-01-10T14:07:20Z
dc.date.available2017-01-10T14:07:20Z
dc.date.issued2016
dc.identifier.urihttp://hdl.handle.net/2117/98964
dc.descriptionDeep learning techniques are a main trend in computer vision but still with little exploration in the field of visual search in big data. One topic of interest is finding instances of objects, people or locations in a large dataset of videos. Student is required to develop and test new solutions based on convolutional neural networks. Related works: DCU @ TRECVID Instance Search 2014 https://imatge.upc.edu/web/publications/insight-centre-data-analytics-dcu-trecvid-2014-instance-search-and-semantic-indexing Sergi Porta BSc thesis (2015): https://imatge.upc.edu
dc.description.abstractThis work explores diverse practices for conducting an object search from large amounts of egocentric images taking into account their temporal information. The application of this technology is to identify where personal belongings were lost or forgotten. We develop a pipeline-structured system. Firstly, the images of the day being scanned are sorted based on their probability to depict the forgotten object. This stage is solved by applying an existing visual search engine based on deep learning features. Secondly, a learned threshold selects the top ranked images as candidates to contain the object. Finally the images are reranked based on temporal and diversity criteria. Furthermore, we build a validation environment for assessing the system's performance aiming to find the optimal configuration of its parameters. Due to the lack of related works to be compared with, this thesis proposes an novel evaluation framework and metric to assess the problem.
dc.description.abstractEste trabajo explora diversas prácticas para realizar búsqueda de objetos en grandes volumenes de imágenes egocéntricas considerando, además, la información temporal de estas con el objetivo de identificar el lugar donde se han dejado, perdido o olvidado objetos personales. Desarrollamos un sistema con estructura secuencial de etapas. En primer lugar, se lleva a cabo una búsqueda de las imagenes con más probabilidad de describir el objeto. Esta etapa se realiza aplicando motores de búsqueda visual ya existentes basados en \textit{deep learning}. En segundo lugar, un umbral aprendido escoge las mejores imágenes como candidatas a contener el objeto. Finalmente, las imágenes son reordenadas temporalmente aplicando criterios de diversidad. Además, construimos un entorno de validación del funcionamiento del sistema con el objetivo de encontrar la configuración óptima de sus parámetros. Dado que no hay trabajos similares con los que nos podamos comparar, el trabajo define un entorno y una métrica para la evaluación del problema.
dc.description.abstractAquest treball explora diverses pràctiques per realitzar cerca d'objectes en grans volums d'imatges egocèntriques considerant, a més, la informació temporal d'aquestes amb l'objectiu d'identificar on s'han deixat, perdut o oblidat els objectes personals. Desenvolupem un sistema amb estructura seqüencial d'etapes. En primer lloc, es duu a terme una cerca de les imatges que tenen més probabilitat de descriure l'objecte. Aquesta etapa es realitza aplicant motors de cerca visual ja existents basats en \textit{deep learning}. En segon lloc, un llindar après escull les millors imatges com a candidates a contenir l'objecte. Finalment, les imatges són reordenades temporalment aplicant criteris de diversitat. A més, construïm un entorn de validació del funcionament del sistema amb l'objectiu de trobar la configuració òptima dels seus paràmetres. Donat que no hi ha treballs similars amb els què ens poguem comparar, el treball defineix un entorn i una mètrica per a l'avaluació del problema.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshArtificial intelligence
dc.subject.lcshData compression (Telecommunication)
dc.subject.lcshImage processing
dc.subject.otherEgocentric
dc.subject.otherRetrieval
dc.subject.otherImage
dc.subject.otherLifelog
dc.subject.otherLifelogging
dc.subject.otherGround truth
dc.subject.otherInstance Search
dc.subject.otherSaliency
dc.subject.otherBag of Words
dc.subject.otherDeep Learning
dc.subject.otherEgocéntricas
dc.subject.otherBúsqueda de Instáncias
dc.subject.otherPredicció
dc.subject.otherAlgorismes
dc.subject.otherFotografia digita
dc.subject.otherCodificació d'imatge
dc.subject.otherVisió per ordinador
dc.titleTime-Sensitive egocentric image retrieval for finding objects in Lifelogs
dc.title.alternativeSistema de búsqueda en imágenes egocéntricas para localizar objetos en Lifelogs
dc.title.alternativeSistema de cerca en imatges egocèntriques per a localitzar objectes en Lifelogs
dc.typeBachelor thesis
dc.subject.lemacIntel·ligència artificial
dc.subject.lemacDades -- Compressió (Telecomunicació)
dc.subject.lemacImatges -- Processament
dc.identifier.slugETSETB-230.114526
dc.rights.accessOpen Access
dc.date.updated2016-07-19T05:56:20Z
dc.audience.educationlevelGrau
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeGRAU EN CIÈNCIES I TECNOLOGIES DE TELECOMUNICACIÓ (Pla 2010)
dc.contributor.covenanteeDublin City University


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record