Detecció i classificació de sons superposats
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/359196
Correu electrònic de l'autormarc.leon.gimenogmail.com
Tipus de documentTreball Final de Grau
Data2021-07-12
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement 3.0 Espanya
Abstract
DCASE Challenge es una competición internacional anual para realizar evaluaciones de sistemas de detección y clasificación de audio. Los desafíos suelen implicar diversas tareas, como por ejemplo la detección de sonidos ambientales, el etiquetado de sonidos cotidianos, la ubicación espacial de los sonidos, etc. La mayoría de los sistemas se basan en técnicas de aprendizaje automático y de aprendizaje profundo (Deep Learning). El objetivo de este proyecto es detectar diferentes clases de sonidos superpuestos y generar las etiquetas temporales de inicio y fin de los segmentos. Se utilizarán los datos de la edición DCASE-2017 para la tarea 3 "Sound event detection in real life audio". DCASE Challenge is an annual international competition to carry out the evaluation of sound detection and classification systems. Challenges often involve various tasks, such as detecting ambient sounds, labeling everyday sounds, spatial location of sounds, etc. Most systems are based on machine learning and Deep Learning techniques. The aim of this project is to detect different types of overlapped sound events and generate the time labels for the beginning and the end of the segments. Data from the DCASE-2017 edition for task 3 “Sound event detection in real life audio” will be used. Actualment, els models basats en l’aprenentatge automàtic estan prenent gran importància
en l’àmbit del processament de dades. Els sistemes desenvolupats a partir d’aquesta
tecnologia permeten processar una gran quantitat d’informació i extreure’n les
característiques més rellevants, oferint així, una gran varietat d’aplicacions, cadascuna
donant solució a tasques concretes.
Aquest treball es centra en l’àmbit de la detecció i la classificació d’esdeveniments acústics,
concretament en la identificació de sons reals enregistrats a la via pública.
Al llarg d’aquest projecte es realitzarà el desenvolupament d’un sistema basat en
l’aprenentatge automàtic, utilitzant tècniques d’aprenentatge profund. Així doncs, el
sistema ha de ser capaç, per una banda, de detectar i classificar els esdeveniments
acústics presents en diversos senyals d’àudio i, per altra banda, de generar les etiquetes
temporals per cada un d’ells on s’indiqui l’instant de temps d’inici i final de cada un dels
esdeveniments detectats.
Per poder dur a terme aquest projecte, s’utilitzarà la base de dades facilitada en el repte
‘DCASE Challenge’ de l’any 2017. Concretament, s’utilitzarà la base de dades facilitada
per la tasca 3, ‘Sound event detection in real life audio’.
En aquest sentit, es realitzarà una anàlisis de la base de dades i del sistema de referència
proposats per l’organització del repte per comprendre les tecnologies de processament
utilitzades i poder desenvolupar el sistema propi.
L’objectiu no és participar en el repte escollit ni proposar un sistema amb millors resultats
que el sistema de referència. Amb el desenvolupament d’aquest projecte es pretén
entendre el funcionament dels sistemes de detecció i classificació d’àudio i les tècniques
utilitzades pel processament dels senyals acústics.
Finalment, en base als resultats obtinguts i les observacions realitzades, es presentaran
noves línies de desenvolupament que permetin la continuació d’aquest projecte.
En trets generals, d’aquest projecte es pot extreure que les solucions a una tasca
d’aprenentatge automàtic no són úniques, de tal manera que, els criteris seguits per escollir
la configuració per desenvolupar el sistema poden influir considerablement en els resultats
obtinguts.
TitulacióGRAU EN ENGINYERIA DE SISTEMES AUDIOVISUALS (Pla 2009)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Memoria_Marc_Leon_Gimeno.pdf | 1,441Mb | Visualitza/Obre |