A Deep Learning Based Tool For Ear Training
View/Open
Cita com:
hdl:2117/389818
Document typeBachelor thesis
Date2023-05-16
Rights accessOpen Access
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
L'objectiu principal d'aquest projecte és utilitzar tècniques d'aprenentatge profund per desenvolupar una eina capaç de generar exercicis de dictat melòdic significatius perquè els professors de música i els seus estudiants els utilitzin i practiquin. Un exercici significatiu seria aquell que segueix una progressió d'acords i té un cert grau de musicalitat. Per aconseguir això, el conjunt de dades de Nottingham es va preprocessar i formatar acuradament de tal manera que només es van retenir les característiques més rellevants abans d'alimentar-les al model. Després d'ajustar els hiperparàmetres d'un model amb una arquitectura similar a la d'un model GPT (Transformador Generatiu Pre-entrenat), els models amb millor rendiment es van avaluar utilitzant mètriques sintètiques així com per professors amb experiència en música. Encara que els resultats no van complir amb les expectatives desitjades a causa de certes decisions preses durant la fase de preprocessament, el projecte ofereix valuoses idees i recomanacions per continuar progressant en el desenvolupament d'un sistema que satisfaci eficaçment les necessitats dels professors i estudiants de música. The primary objective of this thesis is to utilize deep learning techniques to develop a tool capable of generating meaningful melodic dictation exercises for music teachers and their students to use and practice with. A meaningful exercise would be one that follows a chord progression and has a certain degree of musicality. To achieve this, the Nottingham dataset was carefully preprocessed and formatted in such a way that only the most relevant characteristics were retained before being fed into the model. After fine-tuning the hyperparameters of a model with an architecture resembling that of a GPT (Generative Pre-trained Transformer) model, the best performing models were evaluated using synthetic metrics as well as by teachers with a background in music. Although the results did not meet the desired expectations due to certain decisions made during the preprocessing phase, the project offers valuable insights and recommendations for continued progress in developing a system that effectively meets the needs of music teachers and students.
DegreeGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)
Collections
Files | Description | Size | Format | View |
---|---|---|---|---|
172751.pdf | 5,372Mb | View/Open |