Show simple item record

dc.contributorAzizpour, Hossein
dc.contributorVilaplana Besler, Verónica
dc.contributor.authorCatà Villà, Marcel
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2019-05-23T20:45:00Z
dc.date.available2019-05-23T20:45:00Z
dc.date.issued2019-05-08
dc.identifier.urihttp://hdl.handle.net/2117/133405
dc.description.abstractObject detection is particularly important in robotic applications that require interaction with the environment. Although 2D object detection methods obtain accurate results, these are not enough to provide a complete description of the 3D scenario. Therefore, many models have recently showed promising progresses in this challenging field [5, 22, 25, 30]. In this work, the goal is to predict 3D bounding boxes from single images without using temporal data nor any explicit depth estimation. We propose an approach for 3D monocular object detection based on Deep3DBox [20]. We aim to replace the geometric constraints taken into account to predict the 3D location of objects by a deep learning module. Moreover, we undertake a study on the different parameters for the modules that are used to predict dimensions and orientation of objects. We conduct experiments in order to search for the best hyperparameters of our model for KITTI [7] cars and we reported and compared our results on KITTI and the challenging NuScenes [2] benchmarks for cars and pedestrians with other state of the art methods. Therefore, we conclude that our approach performs on par with similar methods [22, 30] and improves Deep3DBox [20] results.
dc.description.abstractLa detecció d'objectes és particularment important en aplicacions robòtiques que requereixen interacció amb l'entorn. Tot i que s'han obtingut resultats acurats en detecció d'objectes en 2D, aquests no són suficients per a donar una descripcó completa de l'entorn en 3D. De totes maneres, força models han demostrat progressos prometedors en aquest camp [5, 22, 25, 30]. L'objectiu d'aquest treball és predir bounding boxes 3D a partir d'imatges sense utilitzar informació temporal ni cap predicció de profunditat explícitament. Proposem un model per detecció monocular d'objectes 3D basada en Deep3DBox [20]. Volem substituir les restriccions geomètriques usades per predir la localització en 3D dels objectes per un mòdul de deep learning. A més, duem a terme un estudi sobre els diferents paràmetres dels mòduls utilitzats per a predir les dimensions i l'orientació dels objectes. Hem realitzat experiments per tal de cercar els millors hiperparàmetres pel nostre model pels cotxes de KITTI [7] i hem reportat i comparat els nostres resultats sobre KITTI i NuScenes en cotxes i vianants amb els altres metòdes de l'state of the art. Finalment, concloem que el nostre model obté resultats al nivell dels mètodes similars [22, 30] i millora els resultats de Deep3DBox [20]
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshMachine learning
dc.subject.lcshComputer vision
dc.subject.lcshAutonomous vehicles
dc.subject.otherobject detection
dc.subject.otherautonomous driving
dc.title3D Bounding box detection from monocular images
dc.title.alternativeDetecció de bounding boxes 3D a partir d'imatges monoculars
dc.typeMaster thesis
dc.subject.lemacAprenentatge automàtic
dc.subject.lemacVisió per ordinador
dc.subject.lemacVehicles autònoms
dc.identifier.slugETSETB-230.139490
dc.rights.accessOpen Access
dc.date.updated2019-05-22T05:51:11Z
dc.audience.educationlevelMàster
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeMÀSTER UNIVERSITARI EN ENGINYERIA DE TELECOMUNICACIÓ (Pla 2013)


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record