Componente de reconocimiento de imágenes para IRIS, el asistente virtual de Mango
View/Open
178341.pdf (3,032Mb) (Restricted access)
Cita com:
hdl:2117/394225
CovenanteeMango
Document typeBachelor thesis
Date2023-06-26
Rights accessRestricted access - confidentiality agreement
(embargoed until 2028-06-11)
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
En los últimos años, los avances en Deep Learning cada vez son más notables. Estos progresos están transformando los algoritmos de Machine Learning, permitiendo realizar tareas más demandantes y sofisticadas como el reconocimiento de imágenes. Uno de los sectores beneficiados por la Computer Vision es el de los asistentes virtuales. Estos asistentes, hasta ahora capaces de entender voz y texto, ya pueden reconocer imágenes en tiempo real, pudiendo dar información conveniente sobre estas. El asistente virtual IRIS es uno de los productos desarrollados por el departamento de IT de Mango. Este asistente permite automatizar una gran cantidad de conversaciones con los clientes de la marca. Estos clientes han impulsado el crecimiento de nuevos canales de comunicación como las redes sociales. Con la entrada de IRIS en las redes sociales, se ha hecho muy común que las conversaciones contengan datos visuales, los cuales el asistente virtual no es capaz de comprender. Por ello, el objetivo de este trabajo de fin de grado es la creación de un módulo de reconocimiento de imágenes con Computer Vision. Este módulo será capaz de adaptarse al asistente virtual actual con el objetivo de automatizar las conversaciones con datos visuales y dar respuestas a los clientes más rápido. Para conseguir el objetivo se han creado dos componentes que se integran en el asistente virtual existente. El primero es el componente de reconocimiento de imágenes con Computer Vision. Este componente, dada una imagen, devuelve un conjunto de datos relacionados con esta. Con estos datos, el segundo componente se encarga de interpretarlos y categorizarlos en una de las categorías válidas para Mango. Para el componente de categorización se han recopilado datos, se ha creado una herramienta para analizarlos, se han analizado y se ha creado un algoritmo que los clasifica en las categorías de Mango. Estos dos componentes se han integrado en el asistente de manera que cumplan todos los requisitos necesarios y definidos. Por último, se han creado un conjunto de flujos en Dialogflow CX, para que cuando una imagen sea categorizada se proceda a dar una respuesta al usuario. Además del desarrollo se ha hecho un estudio de la arquitectura, se han definido los requisitos y se ha validado el desarrollo con un conjunto de pruebas extenso. Por tanto, se concluye que el desarrollo del módulo de reconocimiento de Mango será beneficioso, ya que permitirá automatizar un gran número de conversaciones con datos visuales. In recent years, advances in Deep Learning have become increasingly remarkable. These advances are transforming Machine Learning algorithms, making it possible to perform more demanding and sophisticated tasks such as image recognition. One of the sectors benefiting from Computer Vision is that of virtual assistants. These assistants, until now capable of understanding voice and text, can now recognize images in real time, and can provide convenient information about them. The IRIS virtual assistant is one of the products developed by Mango's IT department. This assistant automates a large number of conversations with the brand's customers. These customers have driven the growth of new communication channels such as social networks. With the entry of IRIS in social networks, it has become very common for conversations to contain visual data, which the virtual assistant is not capable to understand. Therefore, the objective of this final degree work is the creation of an image recognition module with Computer Vision. This module will be able to be adapted to the current virtual assistant to automate conversations with visual data and give answers to customers faster. To achieve this goal, two components have been created and integrated into the existing virtual assistant. The first one is the image recognition component with Computer Vision. This component, given an image, returns a set of data related to this image. With this data, the second component is used to interpret and categorize the data into one of the categories valid for Mango. For the categorization component, data have been collected, a tool has been created to analyze them, they have been analyzed and an algorithm has been created to classify them into the categories of Mango. These two components have been integrated into the assistant in such a way that they meet all the necessary and defined requirements. Finally, a set of flows have been created in Dialogflow CX, so that when an image is categorized, a response is given to the user. In addition to the development, a study of the architecture has been made, the requirements have been defined and the development has been validated with an extensive set of tests. Hence, it is concluded that the development of the Mango recognition module will be beneficial, as it will allow the automation of a large number of conversations with visual data.
DegreeGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)
Collections
Files | Description | Size | Format | View |
---|---|---|---|---|
178341.pdf | 3,032Mb | Restricted access |