Model optimization for chess pieces classification
View/Open
Cita com:
hdl:2117/402342
Document typeBachelor thesis
Date2023-10-18
Rights accessOpen Access
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
Aquest treball de fi de grau investiga l'ús d'arquitectures d'aprenentatge profund per a la tasca de digitalització automàtica de partides d'escacs. El treball previ és escàs i, tot i que ha mostrat resultats prometedors, les tècniques encara necessiten millores addicionals per permetre'n un ús pràctic en producció. La nostra primera contribució es va fer comparant el rendiment de ResNet50, NASNet Mobile, Mobilenet i VGG16 en la classificació de les peces d'escacs a partir d'una imatge de la peça. L'estudi va trobar que totes les arquitectures van ser capaces d'assolir una precisió satisfactòria, arribant al 98\% d'exactitud amb ResNet50. Aquestes arquitectures es van entrenar per desenvolupar un sistema capaç de recuperar les posicions en un tauler d'escacs a partir d'una imatge. En les millors condicions, el sistema pot digitalitzar una imatge d'un tauler d'escacs en 4 segons amb una exactitud del 75\%. Els resultats de les proves de producció destaquen la importància de l'ús de coneixement del domini que tinguem a la nostra disposició i una extracció cuidadosa de les dades, ja que creiem que la majoria de les imprecisions que el sistema cometeix es podrien resoldre amb la introducció d'informació del domini i una forma més òptima d'obtenir les caselles del tauler. L'estudi també proporciona informació sobre el consum d'energia durant l'entrenament de les Xarxes Neuronals Convolucionals. This bachelor's thesis investigates the use of deep learning architectures for the task of automatic digitization of chess games. Previous work is scarce and, although it has shown promising results, the techniques still need further enhancements to allow a practical use in production. Our first contribution was done by comparing the performance of ResNet50, NASNet Mobile, Mobilenet, and VGG16 when classifying chess pieces given a piece image. The study found that all the architectures were able to retrieve a high satisfactory accuracy, reaching a 98\% accuracy with ResNet50. Those architectures were trained in order to develop a system able to retrieve the positions in a chess board given just an image. In the best conditions, the system is able to digitise a chess board image in 4 seconds with a 75\% accuracy. The results from the production testing highlight the importance of the use of domain knowledge and a careful extraction of the data, as we believe that the majority of imprecisions the system makes could be solved with the introduction of domain information and a more optimal way to get the squares from the board. The study also gives some insight about the energy consumption of the Convolutional Neural Networks training.
SubjectsComputer vision, Computer chess, Transfer of training, Visió per ordinador, Escacs per ordinador, Transferència de l'aprenentatge
DegreeGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)
Files | Description | Size | Format | View |
---|---|---|---|---|
178224.pdf | 3,065Mb | View/Open |