Show simple item record

dc.contributorTorralba, Antonio
dc.contributorMorros Rubió, Josep Ramon
dc.contributor.authorFelip Díaz, Bernat
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.coverage.spatialeast=-71.09416; north=42.360091; name=Vassar St @ Mass Ave, Cambridge, MA 02142, Estats Units d'Amèrica
dc.date.accessioned2020-11-19T11:01:31Z
dc.date.available2020-11-19T11:01:31Z
dc.date.issued2020-10-16
dc.identifier.urihttp://hdl.handle.net/2117/332545
dc.description.abstractEn aquest projecte, diversos models d’aprenentatge profund d’última generació s'han fet servir per extreure informació útil de programes de televisió per en un futur poder analitzar les interaccions de les persones que es mostren al programa. Més precisament, models d'identificació de persones, llocs i locutor s'han entrenat i executat en episodis de la temporada 21 del programa Big Brother. Quan va ser possible, cadascun d’aquests problemes individuals s'ha intentat abordar de la manera més automàtica, però quan calia (i també per recopilar dades reals) la plataforma de crowd-sourcing Amazon Mechanical Turk s'ha utilitzat. Finalment, tota la informació recopilada s'ha agregat en una senzilla interfície de visualització que respon a consultes sobre les persones, el lloc o el locutor presents a cada fotografia.
dc.description.abstractEn este proyecto, varios modelos de aprendizaje profundo de última generación han sido usados para extraer información de programas de televisión con el fin de, en un futuro, poder analizar las interacciones de las personas mostradas en el programa. Más precisamente, modelos de identificación de persona, lugar y locutor han sido entrenados y ejecutados en episodios de la temporada 21 del programa Big Brother. Cuando fue posible, cada uno de estos problemas individuales ha sido abordado de la manera más automática, pero cuando fue necesario (y también para recopilar datos reales) la plataforma de crowd-sourcing Amazon Mechanical Turk ha sido usada. Finalmente, toda la información recopilada ha sido agregada en una sencilla interfaz de visualización que responde a consultas sobre las personas, el lugar o el locutor presentes en cada toma.
dc.description.abstractIn this project, several state of the art deep learning models were used to extract usable information from TV shows in order to, in the future, be able analyze the interactions of the people shown in the program. More precisely, person, place and speaker identification models were trained and run on episodes from the 21st season of the Big Brother program. When possible, each of these individual problems were tackled in the most automatic way but when needed (and also to collect ground truth data) the crowd-sourcing platform Amazon Mechanical Turk was used. Finally, all the collected information was aggregated into a simple visualization interface which answers to queries regarding the people, place or speaker present in each shot.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Spain
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshInteractive television
dc.subject.othervisió per computador
dc.subject.othercomprensió de video
dc.subject.otheraprenentatge profund
dc.subject.otherreconeixement d'imatge
dc.titleUnderstanding human interaction in TV shows
dc.typeBachelor thesis
dc.subject.lemacAudiència -- Investigació
dc.subject.lemacTelevisió interactiva
dc.identifier.slugPRISMA-152888
dc.rights.accessOpen Access
dc.date.updated2020-11-18T19:37:31Z
dc.audience.educationlevelGrau
dc.audience.mediatorUniversitat Politècnica de Catalunya. Centre de Formació Interdisciplinària Superior
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.contributor.covenanteeMassachusetts Institute of Technology
dc.description.mobilityOutgoing


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain