Mostra el registre d'ítem simple

dc.contributorPastor, Dominique
dc.contributorGaude, Nicolas
dc.contributor.authorBeraza Garayalde, Aritz
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2016-11-14T10:53:50Z
dc.date.available2016-11-14T10:53:50Z
dc.date.issued2007-09
dc.identifier.urihttp://hdl.handle.net/2117/96595
dc.description.abstractEvolution of digital entertainment systems has turned simple STBs into complex multimedia centers that integrate in on device all kinds of media playback from all kinds of sources. IP/Cable, Satellite or DTV broadcast are no longer the only content sources, shared media from local sources like smartphones, streaming and on demand Internet services are now as popular as them. Such a gorgeous quantity of media is hard to organize and render accessible, that is why Media-Centers/STBs have become more and more complex to use in recent years. New kinds of human interaction interfaces are needed, and one of the most promising ones is by simply talking to them. This is not new. We?ve been talking to machines for decades. Telephony speech driven interfaces have been among us for man years. Voice control interfaces have evolved from simple fixed command systems to the modern mixed initiative natural language ones. And now, we have the first generation of STB hardware powerful enough to implement them. This paper will study the possibilities, drawbacks and workarounds to implement such a control interface on a STB.
dc.description.abstractLa evolución de los sistemas de entretenimiento digital ha convertido las sencillas STBs en complejos centros multimedia que incorporan en un dispositivo la capacidad de reproducir contenidos de todo tipo de fuentes. Las transmisiones por IP/Cable, satélite o TDT ya no son los únicos orígenes de contenido, han de coexistir con fuentes locales como ordenadores o smartphones así como servicios de streaming bajo demanda en Internet. Tamaña cantidad de contenido es a la vez dificil de organizar como de hacer accesible, razón por la cual año tras año los Media-Centers/STBs son año tras año màs complejos de operar. Se necesitan nuevas interfaces de control para resolver este problema, y uno de los más prometedores son las interfaces de control voca. Estos sistemas no son nuevos. Llevamos hablando con las máquinas desde hace muchos años, recordemos los contestadores automáticos vocales. Estos sistemas han evolucionado desde sistemas que reconocían unos pocos comandos prefijados a los complejos sistemas vocales de lenguaje natural e iniciativa mixta de hoy en día. Finalmente, tenemos la primera generación de hardware STB con la capacidad para implementar una interfaz similar. Este proyecto estudia las posibilidades, dificultades y soluciones de implementar una interfaz de control vocal en una STB.
dc.description.abstractL'evolució dels sistemes d'entreteniment digital ha convertit les senzilles STBs en complexos centres multimèdia que incorporen en un dispositiu la capacitat de reproduir continguts de tot tipus de fonts. Les transmissions per IP / Cable, satèl·lit o TDT ja no són els únics orígens de contingut, han de coexistir amb fonts locals com ordinadors o smartphones així com serveis de streaming sota demanda per Internet. Tan gran quantitat de contingut és alhora difícil d'organitzar com de fer accessible, raó per la qual any rere any els Media-Centers / STBs són any rere any mes complexos d'operar. Calen noves interfícies de control per resoldre aquest problema, i un dels més prometedors són les interfícies de control provoca. Aquests sistemes no són nous. Portem parlant amb les màquines des de fa molts anys, recordem els contestadors automàtics vocals. Aquests sistemes han evolucionat dels primitius sistemes que reconeixien uns pocs comandaments prefixats als complexos sistemes vocals de llenguatge natural i iniciativa mixta d'avui dia. Finalment, tenim la primera generació de hardware STB amb la capacitat per implementar una interfície semblant. Aquest projecte estudia les possibilitats, dificultats i solucions d'implementar una interfície de control vocal en una STB.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic
dc.subject.lcshVoice coding
dc.subject.lcshAutomatic speech recognition
dc.subject.lcshMarkov processes
dc.subject.lcshMultimedia systems
dc.subject.othervoice control
dc.subject.otherspeech recognition
dc.subject.otherhidden markov models
dc.subject.otherhuman machine interface
dc.subject.othermultimedia devices
dc.subject.othercontrol vocal
dc.subject.othercodificación de voz
dc.subject.othersistemas multimedia
dc.subject.otherprocesos ocultos de markov
dc.subject.otherinterfaz de usuario
dc.subject.otherMarkov
dc.titleSpeech control & media sharing for Media Centers
dc.title.alternativeControl vocal per Media-Centers
dc.title.alternativeSistema de control vocal para Media Centers
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacCodificadors de veu
dc.subject.lemacReconeixement automàtic de la parla
dc.subject.lemacMarkov, Processos de
dc.subject.lemacSistemes multimèdia
dc.identifier.slugETSETB-230.73256
dc.rights.accessOpen Access
dc.date.updated2016-11-11T07:06:49Z
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)
dc.contributor.covenanteeÉcole nationale supérieure des télécommunications de Bretagne
dc.contributor.covenanteeNDS France


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple