Anomaly detection of perfume glass bottles using deep learning techniques
View/Open
tfmalexcalle.pdf (6,223Mb) (Restricted access)
Cita com:
hdl:2117/397007
Document typeMaster thesis
Date2023-10-13
Rights accessRestricted access - author's decision
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
L'ús de tècniques d'aprenentatge profund per a tasques de classificació d'imatges s'ha estès àmpliament durant els últims anys; Concretament, la seva aplicació en escenaris industrials, pren cada dia més rellevància, i és un d'aquests escenaris industrials el tema principal de tot aquest treball: La detecció d'anomalies en ampolles de vidre de perfum mitjançant la inspecció d'imatges. Realitzar la detecció d'anomalies en l'àmbit industrial, normalment requereix entrenar els models d'IA amb només un tipus de mostres; és a dir, mostres normals (no anomalies). Això, per la incertesa en què pot aparèixer una anomalia; l'usuari final en aquest cas, no sap quin tipus d'anomalies esperar en una ampolla, aquestes podrien estar trencades a la part superior, rascades al centre, costat esquerre o dret del cos, esquerdades a la seva base, etc. En aquest projecte s'estudien tres enfocaments per detectar anomalies: l'estudi de l'espai latent d'Autoencoders, l'error de reconstrucció d'imatges d'Autoencoders i l'estructura GAN (Generative Adversarial Network), sovint coneguda com AnoGAN. Per desenvolupar aquests enfocaments, s'utilitzen marcs d'IA Tensorflow i Pytorch. Es comparen els models, s'ajusten els seus hiperparàmetres i s'avaluen els seus rendiments per arribar finalment a l'enfocament d'aprenentatge profund adequat per a aquesta tasca específica. Pel que fa a les mostres d'anomalies que s'utilitzen per a aquest projecte, s'utilitzen dues representacions: imatges d'anomalies generades de manera fictícia i imatges d'anomalies reals. La primera consisteix a pintar línies aleatòries sobre les imatges no anomalies; intentant imitar anomalies aleatòries a la imatge de l'ampolla. El darrer consta d'imatges d'anomalies reals obtingudes de ratllar i trencar algunes parts de l'ampolla de perfum. Les imatges es capturen amb un kit de càmeres industrials professional, juntament amb il·luminació i lents per apropar-se el màxim possible a una aplicació d'escenari real. S'utilitza un kit de càmeres Cognex per a l'adquisició de les imatges. Al final del projecte, es veu que l'enfocament AnoGAN supera els enfocaments típics d'Autoencoder i per a aquesta tasca específica és el més adequat entre les alternatives estudiades. Per a futurs treballs s'aconsella posar més èmfasi en l'espai on es capten la imatge; disposar d'un entorn adequat i controlat per la il·luminació és clau per a la implementació real d'aquest projecte en una indústria real El uso de técnicas de aprendizaje profundo para tareas de clasificación de imágenes se ha extendido ampliamente en los últimos años; En concreto, su aplicación en escenarios industriales, cada día está tomando más relevancia, y es uno de estos escenarios industriales el tema principal de todo este trabajo: La detección de anomalías en frascos de vidrio de perfumes mediante inspección de imágenes. Realizar la detección de anomalías en el campo industrial generalmente requiere entrenar los modelos de IA con un solo tipo de muestras; es decir, muestras normales (sin anomalías). Esto, debido a la incertidumbre en la que puede presentarse una anomalía; el usuario final en este caso, no sabe que tipo de anomalías esperar en una botella, estas podrían ser rotura en la parte superior, raya en el centro, lado izquierdo o derecho del cuerpo, fisura en su base, etc. En este proyecto se estudian tres enfoques para detectar anomalías: el estudio del espacio latente de los Autoencoders, el error de reconstrucción de imágenes de los Autoencoders y la anomalía de la estructura GAN (Generative Adversarial Network), a menudo conocida como AnoGAN. Para desarrollar estos enfoques, se utilizan los marcos de IA Tensorflow y Pytorch. Se comparan los modelos, se ajustan sus hiperparámetros y se evalúa su desempeño para finalmente encontrar el enfoque de aprendizaje profundo apropiado para esta tarea específica. Con respecto a las muestras de anomalías que se utilizan para este proyecto, se emplean dos representaciones: imágenes de anomalías generadas ficticiamente e imágenes de anomalías reales. El primero consiste en pintar líneas aleatorias sobre las imágenes no anomalías; intentando imitar anomalías aleatorias en la imagen de la botella. Este último se compone de imágenes de anomalías reales obtenidas al rayar y romper algunas partes del frasco de perfume. Las imágenes se capturan utilizando un kit de cámara industrial profesional, junto con iluminación y lentes para acercarse lo más posible a una aplicación de escenario real. Se utiliza un kit de cámara Cognex para la adquisición de las imágenes. Al final del proyecto, se ve que el enfoque AnoGAN supera a los enfoques típicos de Autoencoder y para esta tarea específica es el más apropiado entre las alternativas estudiadas. Para futuros trabajos es recomendable aplicar más énfasis en el espacio donde se captura la imagen; Tener un ambiente adecuado con iluminación controlada es clave para la implementación real de este proyecto en una industria real The use of deep learning techniques for image classification tasks has been widely spread over the past years; Specifically, its application in industrial scenarios, is taking more relevance day by day, and it is one of these industrial scenarios that is the main topic of this entire work: The anomaly detection of perfume glass bottles through image inspection. Performing anomaly detection in the industrial field, typically requires training the AI models with only one kind of samples; that is, normal (non-anomaly) samples. This, due to the uncertainty in which an anomaly can appear; the final user in this case, does not know which kind of anomalies to expect in a bottle, these could be broken on the top, scratch in the center, left or right side of the body, cracked in its base, etc. Three approaches for detecting anomalies are studied in this project: Autoencoders’ latent space study, Autoencoders’ image reconstruction error and anomaly GAN (Generative Adversarial Network) structure, often known as AnoGAN. For developing these approaches, Tensorflow and Pytorch AI frameworks are used. The models are compared, their hyperparameters tuned and their performances evaluated to finally come up with the appropriate deep learning approach for this specific task. Regarding the anomaly samples that are used for this project, two representations are employed: Fictionally generated anomaly images and real anomaly images. The former one consists of painting random lines over the non-anomaly images; trying to imitate random anomalies in the bottle image. The later comprises of real anomaly images obtained from actually scratching and breaking some parts of the perfume bottle. The images are captured using a professional industrial camera kit, along with illumination and lenses for approaching as much as possible to a real-scenario application. A Cognex camera kit is used for the acquisition of the images. At the end of the project, it is seen that the AnoGAN approach outperforms the typical Autoencoder approaches and for this specific task is the most appropriate one amongst the studied alternatives. For future works it is advisable to apply more emphasis in the space where the image are captured; having a proper illumination-controlled environment is key for the actual implementation of this project in a real industry
SubjectsPerfumes industry -- Packaging -- Quality control, Pattern recognition systems -- Mathematical models -- Design and construction, Deep learning (Machine learning) -- Industrial applications, Perfumeria -- Envasament -- Control de qualitat, Reconeixement de formes (Informàtica) -- Models matemàtics -- Disseny i construcció, Aprenentatge profund -- Aplicacions industrials
Collections
Files | Description | Size | Format | View |
---|---|---|---|---|
tfmalexcalle.pdf | 6,223Mb | Restricted access |