Anàlisi audiovisual mitjançant descriptors MPEG-7

Document typeMaster thesis (pre-Bologna period)
Date2006-02-24
Rights accessOpen Access
Description
L’objectiu és dur a terme una classificació audiovisual de dibuixos animats a través de descriptors MPEG-7.
Inicialment s’ha creat una base de dades audiovisual sobre dibuixos animats formada per 140 fitxers (de vídeo, d’àudio i de text).
A continuació s’ha implementat el descriptor de textura HTD definit per l'estàndard MPEG-7. Aquest descriptor analitza la potència de la imatge en direccions i bandes en el domini freqüencial.
S’han extret de cada segment de vídeo les característiques associades al descriptor de textura.
Aquestes característiques s’han utilitzat per introduir-les a quatre classificadors (PCA, LDA, M-NN i Fuzzy Integral) i obtenir els resultats de la classificació de vídeos de dibuixos animats.
Per tal de dur a terme una classificació multimodal, s’ha adjuntat el descriptor de textura amb altres descriptors (àudio, moviment i color) .
S’han generat fitxers de classificació amb 43 característiques d’àudio (volum mig, creuaments per zero, ample de banda...) i 79 de vídeo (mitja RGB, autocorrelograma, filtre Gabor nº1, ....).
A partir d’aquests fitxers s’han fet diverses proves de classificació.
En el cas d’utilitzar només el descriptor de textura, els resultats han estat d’un 77% de reconeixement de vídeos de dibuixos animats.
Utilitzant característiques d’àudio i vídeo, el resultat de reconeixement de dibuixos en el millor cas és del 85 %.
Files | Description | Size | Format | View |
---|---|---|---|---|
Anàlisi audiovi ... Enric Bosch Anglarill.pdf | 2,041Mb | View/Open |
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-NoDerivs 3.0 Spain