|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/7947
|
Ítem no disponible en accés obert per política de l'editorial
| Arxiu |
Descripció |
Mida | Format |
| Performance evaluation of macroblock-level....pdf | | 309.1 kB | Adobe PDF |  |
|
| Citació: | Alvarez, M. [et al.]. Performance evaluation of macroblock-level parallelization of H.264 decoding on a cc-NUMA multiprocessor architecture. A: Colombian Computing Conference. "4th Colombian Computing Conference". Bucaramanga: 2009, p. 108-117. |
| Títol: | Performance evaluation of macroblock-level parallelization of H.264 decoding on a cc-NUMA multiprocessor architecture |
| Autor: | Álvarez Mesa, Mauricio ; Ramírez Bellido, Alejandro ; Valero Cortés, Mateo ; Azevedo, Arnaldo; Meenderinck, Cor; Juurlink, Ben |
| Data: | 23-abr-2009 |
| Tipus de document: | Conference report |
| Resum: | This paper presents a study of the performance scalability of a macroblock-level parallelization of the H.264 decoder for High De nition (HD) applications on a multiprocessor
architecture. We have implemented this parallelization on a cache coherent Non-uniform Memory Access (cc-NUMA)
shared memory multiprocessor (SMP) and compared the results with the theoretical expectations. Three di erent scheduling techniques were analyzed: static, dynamic and
dynamic with tail-submit. A dynamic scheduling approach with a tail-submit optimization presents the best performance
obtaining a maximum speed-up of 9.5 using 24 processors. A detailed pro ling analysis showed that thread synchronization is one of the limiting factors for achieving a better parallel scalability. The paper includes an evaluation of the impact of using blocking synchronization APIs like POSIX threads and POSIX real-time extensions. Results showed that macroblock-level parallelism as a very negrain form of Thread-Level Parallelism (TLP) is highly affected by the thread synchronization overhead generated by
these APIs. Other synchronization methods, possibly with hardware support, are required in order to make MB-level parallelization more scalable. |
| ISBN: | 978-958-8166-43-8 |
| URI: | http://hdl.handle.net/2117/7947 |
| Versió de l'editor: | http://serverlab.unab.edu.co:8080/wikimedia/memorias/fullpapers/108.pdf |
| Apareix a les col·leccions: | Altres. Enviament des de DRAC Departament d'Arquitectura de Computadors. Ponències/Comunicacions de congressos CAP - Grup de Computació d´Altes Prestacions. Ponències/Comunicacions de congressos
|
| Comparteix: |
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|