Anàlisi audiovisual mitjançant descriptors MPEG-7
Títol de la revista
ISSN de la revista
Títol del volum
Autors
Correu electrònic de l'autor
Tutor / director
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data
Condicions d'accés
item.page.rightslicense
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
Descripció
L’objectiu és dur a terme una classificació audiovisual de dibuixos animats a través de descriptors MPEG-7. Inicialment s’ha creat una base de dades audiovisual sobre dibuixos animats formada per 140 fitxers (de vídeo, d’àudio i de text). A continuació s’ha implementat el descriptor de textura HTD definit per l'estàndard MPEG-7. Aquest descriptor analitza la potència de la imatge en direccions i bandes en el domini freqüencial. S’han extret de cada segment de vídeo les característiques associades al descriptor de textura. Aquestes característiques s’han utilitzat per introduir-les a quatre classificadors (PCA, LDA, M-NN i Fuzzy Integral) i obtenir els resultats de la classificació de vídeos de dibuixos animats. Per tal de dur a terme una classificació multimodal, s’ha adjuntat el descriptor de textura amb altres descriptors (àudio, moviment i color) . S’han generat fitxers de classificació amb 43 característiques d’àudio (volum mig, creuaments per zero, ample de banda...) i 79 de vídeo (mitja RGB, autocorrelograma, filtre Gabor nº1, ....). A partir d’aquests fitxers s’han fet diverses proves de classificació. En el cas d’utilitzar només el descriptor de textura, els resultats han estat d’un 77% de reconeixement de vídeos de dibuixos animats. Utilitzant característiques d’àudio i vídeo, el resultat de reconeixement de dibuixos en el millor cas és del 85 %.