Ir al contenido (pulsa Retorno)

Universitat Politècnica de Catalunya

    • Català
    • Castellano
    • English
    • LoginRegisterLog in (no UPC users)
  • mailContact Us
  • world English 
    • Català
    • Castellano
    • English
  • userLogin   
      LoginRegisterLog in (no UPC users)

UPCommons. Global access to UPC knowledge

60.175 UPC academic works
You are here:
View Item 
  •   DSpace Home
  • Treballs acadèmics
  • Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
  • Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació (Pla 2015)
  • View Item
  •   DSpace Home
  • Treballs acadèmics
  • Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
  • Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació (Pla 2015)
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Birds Sound Detection Using Convolutional Neural Networks

Thumbnail
View/Open
git_clone_repository_tfg.zip (10,27Mb)
TFG_Thesis.pdf (1,575Mb)
Share:
 
  View Usage Statistics
Cita com:
hdl:2117/134086

Show full item record
Solé Franquesa, Llorenç
Tutor / directorNadeu Camprubí, ClimentMés informacióMés informacióMés informació
Document typeBachelor thesis
Date2019-05
Rights accessOpen Access
Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain
Abstract
The objective of this thesis is to learn how to train and test a Deep Neural Network (DNN). For that purpose, after reviewing recent works, we have chosen the bird sound detection task of the DCASE Challenge 2018, that involves three databases of 10sec-long audio files which include positive and negative samples of presence of bird sounds in different recording condi- tions. Using a Convolutional Neural Network (CNN) architecture, we have carried out a set of experiments, and used transfer learning methodology to deal with the different recording conditions. Finally, we have presented further ways to improve the results.
 
El objetivo de esta tesis es aprender cómo entrenar y probar una red neuronal profunda. Para ese propósito, después de revisar trabajos recientes, hemos elegido la tarea de detección de sonido de aves del DCASE Challenge 2018, que incluye tres bases de datos de archivos de audio de 10 segundos de duración que incluyen muestras positivas y negativas de la presencia de sonidos de aves en diferentes condiciones de grabación. Usando una arquitectura de red neuronal convolucional, hemos llevado a cabo un conjunto de experimentos y hemos utilizado la metodología de aprendizaje por transferencia para tratar las diferentes condiciones de grabación. Finalmente, hemos presentado otras formas de mejorar los resultados.
 
L'objectiu d'aquesta tesi és aprendre com entrenar i provar una xarxa neuronal profunda. Per a aquest propòsit, després de revisar treballs recents, hem triat la tasca de detecció de sons d'aus del DCASE Challenge 2018, que inclou tres bases de dades d'arxius d'àudio de 10 segons de durada que inclouen mostres positives i negatives de la presència de sons d'aus en diferents condicions de gravació. Usant una arquitectura de xarxa neuronal convolucional, hem dut a terme un conjunt d'experiments i hem utilitzat la metodologia d'aprenentatge per transferència per tractar les diferents condicions de gravació. Finalment, hem presentat altres formes de millorar els resultats.
Description
The population of birds, marine mammals, and other species can be monitored through computational analysis of acoustic scenes that may include the sounds of the targeted species. See Ch. 11 of the book "Computational analysis of sound scenes and events", DOI 10.1007/978-3-319-63450-0.
SubjectsNeural networks (Computer science), Machine learning, Artificial intelligence, Xarxes neuronals (Informàtica), Aprenentatge automàtic, Intel·ligència artificial
DegreeGRAU EN ENGINYERIA DE TECNOLOGIES I SERVEIS DE TELECOMUNICACIÓ (Pla 2015)
URIhttp://hdl.handle.net/2117/134086
Collections
  • Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona - Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació (Pla 2015) [608]
Share:
 
  View Usage Statistics

Show full item record

FilesDescriptionSizeFormatView
git_clone_repository_tfg.zip10,27Mbapplication/zipView/Open
TFG_Thesis.pdf1,575MbPDFView/Open

Browse

This CollectionBy Issue DateAuthorsOther contributionsTitlesSubjectsThis repositoryCommunities & CollectionsBy Issue DateAuthorsOther contributionsTitlesSubjects

© UPC Obrir en finestra nova . Servei de Biblioteques, Publicacions i Arxius

info.biblioteques@upc.edu

  • About This Repository
  • Contact Us
  • Send Feedback
  • Inici de la pàgina