Detección facial e identificación de personas en imágenes basado en técnicas Deep Learning
Cita com:
hdl:2117/408853
Document typeBachelor thesis
Date2024-02-08
Rights accessOpen Access
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
L’idea d’aquest projecte es entrenar un model de IA que detecti i identifiqui a persones amb tècniques Deep Learning. Per a la realització del programa, s’ha utilitzat l’algoritme de YOLO. S’ha plantejat per a que s’acabi identificant a 3 persones diferents respecte a la resta de persones que poden aparèixer a les diferents fotografies realitzades.
S’ha basat en la detecció d’objectes aprofitant les seves característiques per a detectar persones. Existeixen paràmetres importants com el Deep Learning y el Machine Learning. El Deep Learning treu el patró de les dades donades a traves de les xarxes neuronals mentre que el Machine Learning es la habilitat per aprendre sense necessitat de estar explícitament programant.
El treball s’ha realitzat amb el llenguatge Python amb l’editor Visual Studio. Per a l’etiquetat de les imatges, s’ha utilitzat l’aplicació labelImg.py. S’ha començat identificant cada una de les persones escollides de manera separada. Un cop realitzat aquest prototip, s’ha modificat el programa per a que realitzi una diferenciació entre les classes creades.
Els valors resultants de l’entrenament son acceptables. Les prediccions d’aquests resultats son: pel model 1 la predicció és del 67%, pel model 2 la predicció és del 100%, pel model 3 la predicció és del 67% i pel model 4 la predicció varia depèn de l’etiqueta. Seguint l’ordre anterior, per a la primera etiqueta la predicció es del 71%, per a la segona etiqueta la predicció és del 100% i per a la tercera etiqueta la predicció es del 56%. Es a dir, pels valors donats, el programa potser una guia per a identificar a les persones seleccionades. Depenent de la classe a identificar, el percentatge de predicció serà major. Això es deu a que, per a cert etiquetatge, la selecció d’imatges es millor.
En conclusió, aquest projecte pot ser la base per a futures millores. La idea de este proyecto es entrenar un modelo de IA para que detecte e identifique a personas con técnicas Deep Learning. Para la realización del programa, se ha usado el algoritmo de YOLO. Se ha planteado para que acabe identificando a 3 personas diferentes respecto a las otras que puedan aparecer en las diferentes fotografías realizadas.
Se basa en la detección de objetos aprovechando sus características para detectar a personas. Existen parámetros importantes como el Deep Learning y el Machine Learning. El Deep Learning saca el patrón de los datos dados a través de las redes neuronales mientras que el Machine Learning es la habilidad para aprender sin necesidad de estar explícitamente programado.
Este trabajo se ha realizado con el lenguaje Python des del programa Visual Studio. Para el etiquetado de las imágenes, se ha usado la aplicación labelImg.py. Se empezará identificando a cada una de las personas escogidas de manera separada. Una vez realizado este prototipo, se modificará el programa para que realice una diferenciación entre las clases creadas.
Los valores resultantes del entrenamiento son aceptables donde las predicciones son: para el modelo 1 la predicción es del 67%, para el modelo 2 la predicción es del 100%, para el modelo 3 la predicción es del 67% y para el modelo 4 la predicción varía dependiendo de la etiqueta. Siguiendo el orden anterior, para la primera etiqueta la predicción es del 71%, para la segunda etiqueta la predicción es del 100% y para la tercera etiqueta la predicción es del 56%. Es decir, a partir de los valores dados, el programa puede ser una guía para identificar a las personas seleccionadas. Dependiendo de la clase a identificar, el porcentaje de predicción será mayor. Esto se debe a que, para ciertos etiquetados, la selección de imágenes sea mejor.
En conclusión, este proyecto puede ser la base para futuras mejoras. The aim of this project is to create a program that can detect and identify people with Deep Learning techniques. To create this, it has been used the YOLO algorithm. The idea is to identify three different people among others. These classes are related with three specific people. The fourth label is for the rest of the people.
This project uses the object detection due of its characteristics to detect people. The Machine Learning is the ability to learn without explicitly being programmed. The Deep Learning is the extract pattern from data using neural networks.
This project is created with the program Visual Studio and the language Python. LabelImg.py will help to label the photographies. First of all, it has started by identifying one person among others that will appear on the images. The first implementation is to make the differentiation between the author and the rest of the people which can appear on the image. The final method and last implementation is to classify four different classes.
In general, the results of the training have been done correctly. The predictions are: for the model 1 the prediction is about the 67%, for the model 2 the prediction is about the 100%, for the model 3 the prediction is about the 71% and for the model 4 the prediction depends on the label. For the first label the prediction is about the 71%, for the second label is about the 100% and for the third one the prediction is about the 56%. So, this is a value which it can be based to predict the chosen people. There are different percentages depending on the label to find. This is because of the selection of the images for each class. Depending on the class are better than the others.
In conclusion, this project can be the base to improve in the future.
SubjectsMachine learning, Artificial intelligence, Human face recognition (Computer science), Aprenentatge profund, Intel·ligència artificial, Identificació de persones, Reconeixement facial (Informàtica)
DegreeGRAU EN ENGINYERIA DE SISTEMES AUDIOVISUALS (Pla 2009)
Files | Description | Size | Format | View |
---|---|---|---|---|
Memoria_TFG_Judit_Salvado_Gomez.pdf | 4,871Mb | View/Open |