Introducción de la información de profundidad en una técnica de co-clustering jerárquico temporal

Alfaro Vendrell, Mónica

Visualitza/Obre

memoria_final.pdf (6,240Mb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Alfaro Vendrell, Mónica

Tutor / directorMarqués Acosta, Fernando

; Varas González, David

Tipus de documentProjecte/Treball Final de Carrera

Data2015-07

Condicions d'accésAccés obert

Attribution-NonCommercial-NoDerivs 3.0 Spain

Llevat que s'hi indiqui el contrari, els continguts d'aquesta obra estan subjectes a la llicència de Creative Commons : Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya

Abstract

Video segmentation aims to consistently group regions that are similar in appearance and movement along a sequence. This task is an essential step of video analysis and it has important applications in video coding, indexing and retrieval, 3D reconstruction, action recognition, etc. In particular, in this thesis, a multiresolution hierarchical co-clustering technique (MRHC) is analyzed in order to include depth information for improving image segmentation in sequences with small variations. This information is invariant to changes on brightness and/or texture and camera position. Thus, it may correct some errors that are present when segmentation techniques based on color and movement are used, because this information is independent of color information of the image and the movement that occurs in the scene. Two considerations can be made. Firstly, all the regions of the same object should share similar depth values and, secondly, depth values from regions that do not belong to the same object show discontinuities. Three different ways of coding depth information in MRHC have been studied in this project. In the first approach, the similarity between regions is weighted according to the depth difference between them. The second approach determines the 3D-neighborhood between regions. Finally, a combination of the previous approaches is considered. The Video Occlusion/Object Boundary Dataset has been used to evaluate the inclusion of the depth on MRHC and to compare this method with the state-of-the-art techniques in the field of video segmentation. The results obtained show that the use of depth information improves the outcome video techniques obtained with the MRHC, outperforming the state-of-the-art methods in this scenario.

La segmentación de una secuencia de video consiste en agrupar de manera coherente regiones que son similares tanto en apariencia como en movimiento a lo largo de un vídeo. Esta tarea es un paso fundamental en el análisis de vídeo y tiene importantes aplicaciones en codificación, indexación y recuperación de vídeo, reconstrucción 3D, reconocimiento de acciones, etc. En concreto, en este Proyecto Final de Carrera se analiza la técnica de co-clustering multiresolución jerárquico para segmentación de vídeo (MRHC) con el objetivo de introducir la información de profundidad para mejorar la segmentación. Esta información facilita la tarea de segmentación porque es invariante a los cambios de iluminación y/o textura y a la posición de la cámara. Por lo tanto, permite corregir algunos de los problemas que presentan las técnicas de segmentación basadas en color y movimiento porque utilizan una información independiente del color de la imagen y del movimiento que se produce en la escena. Se pueden hacer dos consideraciones en cuanto a los valores de profundidad en una escena. Por un lado, los valores de un objeto no varían bruscamente. Por el otro, los valores de profundidad presentan discontinuidades en la frontera entre objetos. En base a estas consideraciones se puede determinar si dos regiones pertenecen al mismo plano de profundidad o no. En este proyecto se han estudiado tres maneras de introducir la información de profundidad en MRHC. La primera consiste en ponderar la similitud entre regiones en función de la diferencia de profundidad entre éstas. Este coeficiente penalizando la similitud a medida que la diferencia aumenta. La segunda consiste en determinar la vecindad entre regiones en 3D. Por último, el tercer enfoque combina los dos anteriores. Se ha utilizado la base de datos Occlusion/Object Boundary para evaluar la inclusión de la profundidad en MRCH y para comparar la técnica actual MRHC con el estado del arte en segmentación de video. Los resultados obtenidos muestran que la inclusión de la profundidad mejora los resultados obtenidos con MRHC, superando las técnicas del estado del arte.

La segmentació de una seqüència de vídeo consisteix en agrupar de forma coherent regions que són similars tant en aparença com en moviment al llarg de un vídeo. Aquesta tasca es un pas fonamental en l’anàlisi de vídeo y té importants aplicacions en codificació, indexació y recuperació de vídeo, reconstrucció 3D, reconeixement d’accions, etc. En concret, en aquest Projecte final de Carrera s’analitza la tècnica de co-clustering multiresolució jeràrquica per segmentació de vídeo (MRHC) amb l’objectiu de introduir la informació de profunditat per millorar la segmentació. Aquesta informació facilita la tasca de segmentació perquè és invariant als canvis de il•luminació i/o textura i a la posició de la càmera. Per això, permet corregir alguns errors que produeixen les tècniques de segmentació basades en el color de la imatge i del moviment que es produeix a l’escena. Es poden fer dues consideracions en quant als valors de profunditat d’una escena. Per una banda, els valors d’un objecte no varien bruscament. Per l’altre, els valors de profunditat presenten discontinuïtats a la frontera entre objectes. Segons aquestes consideracions es pot determinar si dos regions corresponen al mateix pla de profunditat o no. En aquest projecte s’han estudiat tres manera de incorporar la informació de profunditat a MRHC. La primera pondera la similitud entre regions en funció de la diferencia de profunditat entre aquestes. Aquest coeficient penalitza la similitud a mesura que la diferencia augmenta. La segona determina el veïnat entre regions en 3D. Per últim, la tercera combina les dues anteriors. S’ha utilitzat la base de dades Occlusion/Object Boundary per avaluar la inclusió de la profunditat a MRHC i per comparar MRHC amb les tècniques del estat del art en segmentació de vídeo. Els resultats obtinguts mostren que la inclusió de la profunditat obté millora els resultats obtinguts amb MRHC, superant les tècniques del estat del art.

Descripció

Dada una técnica de co-clustering de imágenes en una secuencia de vídeo, se ha estudiado cómo mejorar dicha técnica incluyendo una estimación de la información de profundidad entre las características que explota el co-clustering.

MatèriesImage processing, Computer vision, Imatges -- Processament, Visió per ordinador

TitulacióENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)

URIhttp://hdl.handle.net/2117/78278

Col·leccions

Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona - Enginyeria de Telecomunicació (Pla 1992) [1.590]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
memoria_final.pdf		6,240Mb	PDF	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Introducción de la información de profundidad en una técnica de co-clustering jerárquico temporal

Visualitza/Obre

Explora