Mostra el registre d'ítem simple

dc.contributorTorralba, Antonio
dc.contributor.authorRecasens Continente, Adrià
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2014-10-07T12:48:03Z
dc.date.available2015-10-08T00:31:04Z
dc.date.issued2014-09-03
dc.identifier.urihttp://hdl.handle.net/2099.1/22858
dc.description.abstract[ANGLÈS] Computer vision capabilities have started to become available in smart devices this last years. The rapid growth of the smartphone world along with the big advance of the computer vision field in the last years make possible nowadays to bring computer vision to everyday's mobile devices. DetectMe is one of the firsts systems to bring object detectors to everyone's mobile device. This paradigm shift generates new challenges and questions: this project wants to answer some of this questions as well as give some future lines of work to overcome this challenges. On one hand, the aim of this project is to answer a short question: can we train good detectors with only one example? Section 3 will analyze this issue as well as point out aside questions that appear when the main question is trying to being answered. A positive answer to this question as well as some hints on what makes an object a good example would improve the user experience for those who are using computer vision systems in mobile devices. On the other hand, we will also attack a classical problem in computer vision: where people look when they are looking at a picture? The recent development of the Convolutional Neural Networks and its outstanding capabilities to explain visual information help to improve the performance on the saliency models. In section 4, a new saliency model is presented and discussed. Results show that our saliency model outperforms the state-of-the-art saliency models on the MIT 1001 dataset. Some future research lines are also drawn to improve the model as well as generate more saliency data to work with. To sum up, this project doesn't want to be a closed project. It wants to answer some questions while pointing out potential future lines of research to find a more complete answer.
dc.description.abstract[CASTELLÀ] Los dispositivos móviles han empezado a incorporar capacidades de visión por ordenador en los últimos años. El crecimiento del mundo de los smartphones junto con el progreso en el campo de la visión por ordenador en los últimos años hace posible actualmente tener tecnología de visión por ordenador en teléfonos móviles de uso diario. DetectMe es uno de los primeros sistemas en incorporar la detección de objetos en smartphones convencionales. Este cambio de paradigma genera nuevos retos y cuestiones: este proyecto quiere responder alguna de estas cuestiones y dar potenciales líneas de investigación para superar estos problemas. Por una parte, el objetivo de este proyecto es responder una corta pregunta: podemos entrenar buenos detectores utilizando solo un ejemplo? La sección 3 analizará este problema y planteará otras preguntas relacionadas que aparecen consecuencia de responder la pregunta principal. Una respuesta positiva y descriptiva caracterizando un buen ejemplo mejoraría la experiencia de usuario de aquellos quienes quieren entrenar detectores en dispositivos móviles. Por otra parte, afrontaremos un problema clásico en visión por ordenador: donde mira la gente cuando está mirando una imagen? El desarrollo reciente de las Convolutional Neural Networks y su gran capacidad de explicar información visual ayuda a mejorar el rendimiento del modelo de saliency. Los resultados demuestran que nuestro modelo de saliency mejora los actuales modelos en el data set MIT 1001. Además, se plantean futuras líneas de investigación para mejorar el modelo a la vez que generar más datos con los que trabajar el problema de saliency. Para concluir, este proyecto no quiere ser un proyecto cerrado. Quiere responder algunas preguntas mientras apunta potenciales líneas de investigación para encontrar respuestas más completas.
dc.description.abstract[CATALÀ] Els dispositius mòbils han començat a incorporar capacitats de visió per ordinador en els últims anys. El creixement del món dels mòbils intel·ligents junt amb el progrés en el camp de la visió per ordinador en els últims anys fa possible actualment portar sistemes de visió als telèfons mòbils convencionals. DetectMe és un dels primers sistemes en incorporar detectors d’objectes en un smartphones convencionals. Aquest canvi de paradigma genera nous reptes i qüestions: aquest projecte vol respondre algunes d’aquestes qüestions i donar potencials línies de recerca per superar aquests problemes. Per una banda, l’objectiu d’aquest projecte és respondre una pregunta curta: podem entrenar bons detectors utilitzant tan sols un exemple? La secció 3 analitzarà aquest problema i plantejarà altres preguntes relacionades que apareixen mentre es respon la pregunta principal. Una resposta positiva i descriptiva caracteritzant un bon exemple milloraria l’experiència d’usuari d’aquells qui volen entrenar detectors en dispositius mòbils. Per altra banda, afrontarem un problema clàssic en visió per ordinador: on mira la gent quan està mirant una imatge? El desenvolupament recent de les Convolutional Neural Networks i la seva gran capacitat d’explicar informació visual ajuda a millorar el rendiment dels models de saliency. A la secció 4 presentarem i discutirem un nou model de saliency: els resultat demostren que el nostre model de saliency millora els actuals models en el data set MIT 1001. Endemés, es plantegen futures línies de recerca per millorar el model alhora que generar més dades per treballar en saliency. Per resumir, aquest projecte no vol ser un projecte tancat. Vol respondre algunes preguntes mentre apunta potencials línies de recerca per trobar respostes més completes.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshImage processing
dc.subject.otherobject recognition
dc.subject.otherobject detection
dc.subject.othersaliency prediction
dc.subject.othervisión
dc.subject.otherdetección de objetos
dc.subject.othersaliency
dc.titleObject detection and recognition: from saliency prediction to one-shot trained detectors
dc.title.alternativeDetección y reconocimiento de objetos: de la predicción de saliency al entrenamiento con un solo ejemplo
dc.title.alternativeDetecció i reconeixement d'objectes: de la predicció de saliency a l'entrenament amb un sol exemple
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacImatges -- Processament
dc.identifier.slugETSETB-230.106420
dc.rights.accessOpen Access
dc.date.updated2014-10-02T05:53:19Z
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)
dc.contributor.covenanteeMassachusetts Institute of Technology


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple