Signal Segmentation: Real-Time Piano Performance

Xandri i Zaragoza, Bernat

Visualitza/Obre

BernatXandriZaragoza_FinalDegreeThesis.pdf (4,196Mb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Xandri i Zaragoza, Bernat

Tutor / directorSalembier Clairon, Philippe Jean

Tipus de documentTreball Final de Grau

Data2022-07-05

Condicions d'accésAccés obert

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

Framed in the field of Music Information Retrieval (MIR), there is the widely discussed subject of audio-based Music Structure Analysis (MSA), where the Signal Segmentation Problem would be located. This field of research consists of the study of techniques capable of imitating the human perception of high-level structures that constitute a song. In other words, they aim to be able to identify where one section of the song begins and another ends, in a similar way to how a human listener would perceive it. In this thesis, we present several implementations in the field of Music Segmentation. The first one consists of a revision of an offline segmentation technique, in which some new features have been implemented, thus improving its performance. Going one step beyond the conventional form of this problem, thus seeking new lines of development, a novel real-time segmentation algorithms have also been implemented, which allows the exploration of the aforementioned high-level structures of a piece while it is being performed live. Also, in order to be able to evaluate and analyse the behaviour of the different algorithms, a data-set has been curated to test the different implementations, an evaluation model has been designed to quantify the different solutions, and finally, an automatic optimisation strategy has been implemented to refine the different implementations.

Enmarcado en el campo de la Recuperación de Información Musical (MIR), se encuentra el ampliamente discutido tema del Análisis de Estructuras Musicales (MSA) basado en audio, donde se ubicaría el Problema de la Segmentación de Señales. Este campo de investigación consiste en el estudio de técnicas capaces de imitar la percepción humana de las estructuras de alto nivel que constituyen una canción. Es decir, pretenden ser capaces de identificar dónde empieza un pasaje de la canción y dónde termina otro, de forma similar a cómo lo percibiría un oyente humano. En este trabajo, presentamos varias implementaciones en el campo de la segmentación musical. La primera consiste en una revisión de una técnica de segmentación offline, en la que se han implementado algunas características nuevas, mejorando así su rendimiento. Yendo un paso más allá del formato convencional de este problema, y buscando así nuevas líneas de desarrollo, se ha implementado también un novedoso algoritmo de segmentación en tiempo real, que permite explorar las mencionadas estructuras de alto nivel de una pieza mientras esta se está interpretando en directo. Además, para poder evaluar y analizar el comportamiento de los diferentes algoritmos, se ha elaborado un data-set con el que probar los diferentes algoritmos, se ha diseñado un modelo de evaluación para cuantificar las diferentes soluciones y, finalmente, se ha implementado una estrategia de optimización automática para refinar las diferentes implementaciones.

Emmarcat en l'àmbit de la Recuperació d'Informació Musical (RIM), hi ha el tema àmpliament discutit de l'Anàlisi d'Estructures Musicals (AEM) basat en àudio, on quedaria ubicat el problema de la segmentació del senyal. Aquesta disciplina de recerca consisteix en l'estudi de tècniques capaces d'imitar la percepció humana de les estructures d'alt nivell que constitueixen una cançó. És a dir, pretenen ser capaços d'identificar on comença un passatge de la cançó i on acaba un altre, de manera semblant a com ho percebria un oient humà. En aquesta tesi, presentem diverses implementacions en el camp de la Segmentació Musical. La primera consisteix en una revisió d'una tècnica de segmentació offline, en la qual s'han implementat algunes novetats, millorant així el seu rendiment. Anant un pas més enllà del problema en el seu format convencional, també s'ha implementat un innovador algorisme de segmentació en temps real, que permet l'exploració de les esmentades estructures d'alt nivell d'una peça mentre s'està interpretant en directe. Així mateix, per tal de poder avaluar i analitzar el comportament dels diferents algorismes, s'ha construït un dataset amb el que provar les diferents implementacions, s'ha dissenyat un model d'avaluació per quantificar les diferents solucions i, finalment, s'ha implementat una estratègia d'optimització automàtica per refinar les diferents implementacions.

MatèriesSignal processing--Digital techniques, Algorithms, Sound, Tractament del senyal--Tècniques digitals, Algorismes, So

TitulacióGRAU EN ENGINYERIA DE TECNOLOGIES I SERVEIS DE TELECOMUNICACIÓ (Pla 2015)

URIhttp://hdl.handle.net/2117/381139

Col·leccions

Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona - Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació (Pla 2015) [852]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
BernatXandriZaragoza_FinalDegreeThesis.pdf		4,196Mb	PDF	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Signal Segmentation: Real-Time Piano Performance

Visualitza/Obre

Explora