Deep convolutional neural network architecture for effective Image analysis
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/108914
Realitzat a/ambKungliga Tekniska högskolan
Tipus de documentProjecte Final de Màster Oficial
Data2017
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
This master thesis presents the process of designing and implementing a CNN-based architecture for image recognition included in a larger project in the field of fashion recommendation with deep learning. Concretely, the presented network aims to perform localization and segmentation tasks. Therefore, an accurate analysis of the most well-known localization and segmentation networks in the state of the art has been performed. Afterwards, a multi-task network performing RoI pixel-wise segmentation has been created. This proposal solves the detected weaknesses of the pre-existing networks in the field of application, i.e. fashion recommendation. These weaknesses are basically related with the lack of a fine-grained quality of the segmentation and problems with computational efficiency. When it comes to improve the details of the segmentation, this network proposes to work pixel-wise, i.e. performing a classification task for each of the pixels of the image. Thus, the network is more suitable to detect all the details presented in the analysed images. However, a pixel-wise task requires working in pixel resolution, which implies that the number of operations to perform is usually large. To reduce the total number of operations to perform in the network and increase the computational efficiency, this pixel-wise segmentation is only done in the meaningful regions of the image (Regions of Interest), which are also computed in the network (RoI masks). Then, after a study of the more recent deep learning libraries, the network has been successfully implemented. Finally, to prove the correct operation of the design, a set of experiments have been satisfactorily conducted. In this sense, it must be noted that the evaluation of the results obtained during testing phase with respect to the most well-known architectures is out of the scope of this thesis as the experimental conditions, especially in terms of dataset, have not been suitable for doing so. Nevertheless, the proposed network is totally prepared to perform this evaluation in the future, when the required experimental conditions are available. En aquest treball de fi de màster es presenta el disseny i la implementació
d’una arquitectura pel reconeixement d’imatges fent ús de CNN. Aquesta
xarxa es troba inclosa en un projecte de major envergadura en el camp de la
recomanació de moda. En concret, la xarxa presentada en aquest document
s’encarrega de realitzar les tasques de localització i segmentació. Després d’un
estudi a consciència de les xarxes més conegudes de l’estat de l’art, s’ha
dissenyat una xarxa multi-tasca encarregada de realitzar una segmentació a
resolució de píxel de les regions d’interès de la imatge, les quals han sigut
prèviament calculades i emmascarades. Aquesta proposta soluciona les
mancances detectades en les xarxes ja existents pel que fa a la tasca de
recomanació de moda. Aquestes mancances es basen en la obtenció d’una
segmentació sense prou nivell de detalls i en una rellevant complexitat
computacional. Pel que fa a la qualitat de la segmentació, aquesta tesi proposa
treballar en resolució de píxel, classificant tots els píxels de la imatge de forma
individual, per tal de poder adaptar-se a tots els detalls que puguin aparèixer a
la imatge analitzada. No obstant, treballar píxel a píxel implica la realització
d’una gran quantitat d’operacions. Per reduir-les, proposem fer la
segmentació píxel a píxel només a les regions d’interès de la imatge. A
continuació, després d’un estudi detallat de les llibreries de deep learnign més
destacades, el disseny ha sigut implementat. Finalment s’han dut a terme una
sèrie d’experiments per provar el correcte funcionament del disseny. En
aquest sentit és important destacar que aquesta tesi no té com a objectiu
avaluar el disseny respecte d’altres xarxes ja existents. La raó és que les
condicions d’experimentació, sobretot pel que fa a la base de dades, no són
adequades per aquesta tasca. No obstant, la xarxa està perfectament
preparada per fer aquesta avaluació un cop les condicions d’experimentació
així ho permetin.
Descripció
A Deep Convolutional Neural Network Architecture for effective Image Analysis
MatèriesNeural networks (Computer science), Image analysis, Xarxes neuronals (Informàtica), Imatges -- Anàlisi
TitulacióMÀSTER UNIVERSITARI EN ENGINYERIA DE TELECOMUNICACIÓ (Pla 2013)
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Master_Thesis_Marc_Ros_Marti.pdf | 2,722Mb | Visualitza/Obre |