Show simple item record

dc.contributorGiró Nieto, Xavier
dc.contributorTarrés, Laia
dc.contributor.authorCabot Álvarez, Patricia
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2022-10-05T07:47:18Z
dc.date.available2022-10-05T07:47:18Z
dc.date.issued2022-06-29
dc.identifier.urihttp://hdl.handle.net/2117/373981
dc.description.abstractLa Traducció de la Llengua de Signes és un problema obert que té com a objectiu generar frases escrites a partir de vídeos de signes. En els darrers anys, molts treballs de recerca que s'han desenvolupat en aquest camp van abordar principalment la tasca de Reconeixement de la Llengua de Signes, que consisteix a comprendre els signes d'entrada i transcriure'ls en seqüències d'anotacions. A més, els estudis actuals mostren que aprofitar aquesta darrera tasca ajuda a aprendre representacions significatives i es pot veure com un pas intermig cap a l'objectiu final de traducció. En aquest treball, presentem un mètode per generar pseudo-glosses automàtiques a partir de les frases escrites, que pot funcionar com a substitució de les glosses reals. Això aborda el problema de la seva adquisició, ja que s'han d'anotar manualment i és extremadament costós. A més, introduïm una nova implementació basada en Fairseq de l'enfocament del model Transformer introduït per Camgoz et al., que està entrenat conjuntament per resoldre les tasques de reconeixement i traducció. També proporcionem nous resultats de referència per ambdues implementacions: en primer lloc, per la base de dades Phoenix, presentem resultats que superen els proporcionats per Camgoz et al. en el seu treball i, en segon lloc, per la base de dades How2Sign, presentem els primers resultats de la tasca de traducció. Aquests resultats poden servir de base per a futures investigacions en el camp.
dc.description.abstractSign Language Translation is an open problem whose goal is to generate written sentences from sign videos. In recent years, many research works that have been developed in this field mainly addressed the Sign Language Recognition task, which consists in understanding the input signs and transcribing them into sequences of annotations. Moreover, current studies show that taking advantage of the latter task helps to learn meaningful representations and can be seen as an intermediate step towards the end goal of translation. In this work, we present a method to generate automatic pseudo-glosses from written sentences, which can work as a replacement for real glosses. This addresses the issue of their collection, as they need to be manually annotated and it is extremely costly. Furthermore, we introduce a new implementation built on Fairseq of the Transformer-model approach introduced by Camgoz et al., which is jointly trained to solve the recognition and translation tasks. Besides, we provide new baseline results on both implementations: first, on the Phoenix dataset, we present results that outperform the ones provided by Camgoz et al. in their work, and, second, on the How2Sign dataset, we present the first results on the translation task. These results can work as a baseline for future research in the field.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la imatge i del senyal vídeo
dc.subject.lcshSign language
dc.subject.lcshDeep learning (Machine learning)
dc.subject.otherLlengua de Signes
dc.subject.otherannotacions de glosses
dc.subject.othervideos de signes
dc.subject.otherTraducció de la Llengua de Signes
dc.subject.otherReconeixement de la Llengua de Signes
dc.subject.otherTraducció Automàtica
dc.subject.otherAprenentatge Profund
dc.subject.othermodel Transformer
dc.subject.othermodel Encoder-Decoder
dc.subject.otherSign2Text
dc.subject.otherSign2(Gloss+Text)
dc.subject.otherPhoenix2014T
dc.subject.otherHow2Sign
dc.subject.otherFairseq.
dc.subject.otherSign Language
dc.subject.othergloss annotations
dc.subject.othersign videos
dc.subject.otherSign Language Translation
dc.subject.otherContinous Sign Language Recognition
dc.subject.otherMachine Translation
dc.subject.otherDeep Learning
dc.titleSign language translation with pseudo-glosses
dc.typeBachelor thesis
dc.subject.lemacLlenguatge de signes
dc.subject.lemacAprenentatge profund
dc.identifier.slug170395
dc.rights.accessOpen Access
dc.date.updated2022-07-06T09:47:04Z
dc.audience.educationlevelGrau
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.audience.degreeGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record