Estudi sobre la categorització d'elements terrestres a partir d'imatges aèries de pla zenital

View/Open
Cita com:
hdl:2117/360728
Author's e-mailcardonarosetjavier
gmail.com

Document typeBachelor thesis
Date2021-06-22
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial 3.0 Spain
Abstract
Aquest treball consisteix en la implementació de la xarxa YOLO i la xarxa tiny-YOLO per avaluar la necessitat de la inversió en recursos ja sigui en quantitat d’imatges, o potència computacional per arribar a resolucions méselevades, per aconseguir l’objectiu de millorar la precisió d’aquesta xarxa. El cas concret d’estudi consistirà en un dataset d’imatges de localitzacions de la universitat de Stanford des de el punt de vista d’un dron (StanfordDrone Dataset, SDD) on es detectaran cotxes, carrets de golf, vianants, ciclistes, patinadors en monopatí, i busos. Per avaluar el comentat anteriorment, s’implementarà tant la xarxa YOLO com la tiny-YOLO en diferents plataformes, en concret primer en un ordinador de sobretaula que compta amb certa capacitat computacional(una targeta gràfica Nvidia GeForce GTX 1060 amb 3 GB de RAM), i després en un servidor al núvol de plataformes de lloguer de servidors per serveis de machine learning que compten amb molta varietat de capacitat de potència computacional. A més, caldrà preprocessar les dades del dataset per aconseguir que aquestes siguin vàlides per ser introduïdes a les xarxes com dades d’entrenament. Per últim, es seleccionaran alguns models a entrenar (10 en total) modificant entre aquests models factors com la xarxa utilitzada, la quantitat d’imatges d’entrenament, la resolució d’entrada de les imatges, i alguns paràmetres especials de la xarxa YOLO, per avaluar la capacitat d’aquests sobre el dataset, i així comparar-los entre ells per veure quanta millora hi ha en funció de la inversió en recursos feta. Amb això, s’observarà com les xarxes ofereixen un ampli rang de capacitats en funció dels recursos invertits, anant des de la xarxa tiny-YOLO amb els recursos mínims que arribarà al 36% de mAP@0.5, fins la xarxa YOLO amb els màxims recursos dedicats que arriba a 67% de mAP@0.5. This work consists of the implementation of the YOLO and the tiny-YOLO networks to evaluate the need for investment in resources either in the quantity of images, or computational power to reach higher resolutions, to achieve the objective of improving the accuracy of this networks. The specific case study will consist of a dataset of images of different locations of Stanford University from the point of view of a drone (Stanford Drone Dataset\cite{dataset}, SDD) where cars, golf carts, pedestrians, cyclists, skaters , and buses will be detected. To evaluate the objective, both YOLO and tiny-YOLO networks will be implemented on different platforms, first on a desktop computer that has a certain computational capacity ( Nvidia GeForce GTX 1060 graphics card with 3 GB of RAM), and then on a cloud server rental platform for machine learning services that has a great variety of computational power capacity. In addition, it will be necessary to preprocess the data of the dataset to ensure that it is valid to be introduced into the network as training data. Finally, 10 models will be trained, modifying among these models factors such as the network used, the amount of training images, the resolution of the input images, and some special parameters of the YOLO network, to evaluate their capacity on the dataset, and thus compare them with each other to see how much improvement there is depending on the investment in resources made. With this, will be seen how the networks offer a wide range of capabilities depending on the resources invested, going from the tiny-YOLO network with the minimum resources that will reach 36\% of mAP@0.5, to the YOLO network with the maximum dedicated resources that reaches 67\% of mAP@0.5.
SubjectsNeural networks (Computer science), Artificial intelligence, Internet (Computer network), Xarxes neuronals (Informàtica), Intel·ligència artificial, Internet
DegreeGRAU EN ENGINYERIA EN TECNOLOGIES AEROESPACIALS (Pla 2010)
Files | Description | Size | Format | View |
---|---|---|---|---|
TFG_Memoria.pdf | 15,96Mb | View/Open |