|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/15715
|
Ítem no disponible en accés obert per política de l'editorial
| Arxiu |
Descripció |
Mida | Format |
| p292-gonzalez.pdf | PACT 2008 | 853.24 kB | Adobe PDF |  |
|
| Citació: | González, M. [et al.]. Hybrid access-specific software cache techniques for the cell BE architecture. A: International Conference on Parallel Architectures and Compilation Techniques. "PACT'08. Proceedings of the Seventeenth International Conference on Parallel Architectures and Compilation Techniques". Toronto: Association for Computing Machinery, 2008, p. 292-302. |
| Títol: | Hybrid access-specific software cache techniques for the cell BE architecture |
| Autor: | O’Brien, Kathryn; O'Brien, Kevin; González Tallada, Marc ; Vujic, Nikola; Martorell Bofill, Xavier ; Ayguadé Parra, Eduard ; Eichenberger, Alexandre E.; Chen, Tong; Sura, Zehra; Zhang, Tao |
| Editorial: | Association for Computing Machinery |
| Data: | 2008 |
| Tipus de document: | Conference lecture |
| Resum: | Ease of programming is one of the main impediments for the broad acceptance of multi-core systems with no hardware support
for transparent data transfer between local and global memories. Software cache is a robust approach to provide the user with a
transparent view of the memory architecture; but this software approach can suffer from poor performance. In this paper, we propose a hierarchical, hybrid software-cache architecture that classifies at compile time memory accesses in two classes, highlocality
and irregular. Our approach then steers the memory references toward one of two specific cache structures optimized for their respective access pattern. The specific cache structures are optimized to enable high-level compiler optimizations to
aggressively unroll loops, reorder cache references, and/or transform surrounding loops so as to practically eliminate the
software cache overhead in the innermost loop. Performance evaluation indicates that improvements due to the optimized software-cache structures combined with the proposed codeoptimizations translate into 3.5 to 8.4 speedup factors, compared to a traditional software cache approach. As a result, we
demonstrate that the Cell BE processor can be a competitive alternative to a modern server-class multi-core such as the IBM
Power5 processor for a set of parallel NAS applications. |
| ISBN: | 978-1-60558-282-5 |
| URI: | http://hdl.handle.net/2117/15715 |
| Versió de l'editor: | 10.1145/1454115.1454156 |
| Apareix a les col·leccions: | Altres. Enviament des de DRAC Departament d'Arquitectura de Computadors. Ponències/Comunicacions de congressos CAP - Grup de Computació d´Altes Prestacions. Ponències/Comunicacions de congressos
|
| Comparteix: |
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|