Image compression based on perceptual coding techniques
Visualitza/Obre
10.5821/dissertation-2117-94230
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/94230
Càtedra / Departament / Institut
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
Tipus de documentTesi
Data de defensa1996-03-29
EditorUniversitat Politècnica de Catalunya
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
En aquesta tesi s'estudien els mètodes de codificació d'imatges i seqüències de vídeo des del punt de vista de la forma en què el sistema visual humà percep i entén la informació visual. La rellevància d'aquest estudi ve donada pel paper tan important que tenen els senyals d'imatge en la civilització actual i pel gran volum de dades que representen les fonts d'informació visual pels sistemes que les han de processar. S'han estudiat tres aproximacions per a la codificació de textures en un esquema avançat de compressió fonamentat en aspectes de percepció visual. La primera aproximació es basa en les transicions de la imatge i estudia la interpolació d'àrees suaus a partir de les esmentades transicions. La segona contempla l'extracció, selecció i codificació de detalls significatius per al sistema visual humà.
Finalment, la tercera aproximació estudia la representació eficient de les textures fines i homogènies, que donen una aparença natural a les imatges sintetitzades aconseguint elevades tasses de compressió. Per a l'aplicació d'aquestes tècniques a la codificació d'imatge i vídeo, es proposa un model d'imatge de tres components adaptat a les característiques perceptuals de la visió humana.Les aproximacions de codificació objecte de l'estudi han portat al disseny de tècniques noves d'anàlisi i codificació d'imatge. A partir d'eines no lineals de tractament obtingudes de l'entorn de la Morfologia Matemàtica, s'han desenvolupat tres tècniques de codificació de textures. En concret - Un mètode d'interpolació "morfològica" orientat a la resolució del problema d'interpolació de senyals bidimensionals a partir de conjunts arbitraris de punts dispersos - S'ha introduït de manera experimental un criteri subjectiu empíric per a la ordenació i selecció de detalls en les imatges, segons un criteri perceptual - Finalment, s'ha investigat l'aplicació d'una tècnica clàssica, la codificació "subbanda", a l'interior de regions de forma arbitrària, resultant en un nou mètode de codificació de textures anomenat "Region-based subband coding". Aquestes tècniques han estat innovadores en el camp de codificació d'imatge entre les anomenades tècniques orientades a objectes o de Segona Generació. Tanmateix, el model d'imatge estudiat, es troba en la línia de les últimes propostes en l'entorn de l'MPEG4, el futur estàndard per a comunicació d'imatge a baixa velocitat, que contempla la possibilitat de la manipulació de continguts. This thesis studies image and video sequence coding methods from the point of view of the way the human visual system perceives and understands visual information. The relevance of such study is due, on the one hand, to the important role that visual signals have in our civilization and, on the other hand, to the problem of representing the large amount of data that image and video processing systems have to deal with.
Three different approaches have been investigated for the coding of image textures in an advanced compression scheme relying in aspects of visual perception. The first approach is based on image transitions and the interpolation of smooth areas from such transitions. The second one, considers the extraction, selection and coding of meaningful image details.
Finally, the third approach studies the efficient representation of homogeneous fine textures that give a natural appearance to the reconstructed images at high compression levels. In order to apply these techniques for still image and video coding, a three component model of the image, that matches the perceptual properties of the human vision, is put forward.
The coding approaches subject of research have leaded to the design of three new image analysis and coding techniques. Using non-linear tools from the framework of Mathematical Morphology, three texture coding techniques are developed. In particular
- A "morphological" image interpolation method aimed at the problem of scattered data interpolation.
- An empirical subjective criterion for the ranking and selection of image details according to visual perception
- The application of a conventional image coding technique, subband coding, to the coding of arbitrarily shaped image regions (region-based subband coding).
These are new texture coding techniques in the field of object-oriented and Second Generation image and video coding schemes. Furthermore, the model of the image that has been investigated follows the line of the last proposals in the framework of MPEG4, the forthcoming coding standard for low bit-rate visual communications, which considers the possibility of content-based manipulation and coding of visual information.
Finalment, la tercera aproximació estudia la representació eficient de les textures fines i homogènies, que donen una aparença natural a les imatges sintetitzades aconseguint elevades tasses de compressió. Per a l'aplicació d'aquestes tècniques a la codificació d'imatge i vídeo, es proposa un model d'imatge de tres components adaptat a les característiques perceptuals de la visió humana.Les aproximacions de codificació objecte de l'estudi han portat al disseny de tècniques noves d'anàlisi i codificació d'imatge. A partir d'eines no lineals de tractament obtingudes de l'entorn de la Morfologia Matemàtica, s'han desenvolupat tres tècniques de codificació de textures. En concret - Un mètode d'interpolació "morfològica" orientat a la resolució del problema d'interpolació de senyals bidimensionals a partir de conjunts arbitraris de punts dispersos - S'ha introduït de manera experimental un criteri subjectiu empíric per a la ordenació i selecció de detalls en les imatges, segons un criteri perceptual - Finalment, s'ha investigat l'aplicació d'una tècnica clàssica, la codificació "subbanda", a l'interior de regions de forma arbitrària, resultant en un nou mètode de codificació de textures anomenat "Region-based subband coding". Aquestes tècniques han estat innovadores en el camp de codificació d'imatge entre les anomenades tècniques orientades a objectes o de Segona Generació. Tanmateix, el model d'imatge estudiat, es troba en la línia de les últimes propostes en l'entorn de l'MPEG4, el futur estàndard per a comunicació d'imatge a baixa velocitat, que contempla la possibilitat de la manipulació de continguts.
CitacióCasas Pla, J.R. Image compression based on perceptual coding techniques. Tesi doctoral, UPC, Departament de Teoria del Senyal i Comunicacions, 1996. ISBN 9788469213377. DOI 10.5821/dissertation-2117-94230. Disponible a: <http://hdl.handle.net/2117/94230>
Dipòsit legalB.19339-2009
ISBN9788469213377
Altres identificadorshttp://www.tdx.cat/TDX-0115109-100648
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
01JRc01de01.pdf | 1,760Mb | Visualitza/Obre |