|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/9890
|
Ítem no disponible en accés obert per política de l'editorial
| Arxiu |
Descripció |
Mida | Format |
| ICPP09 tramirez camera ready.pdf | Article | 228.57 kB | Adobe PDF |  |
|
| Citació: | Ramirez, T. [et al.]. Code semantic-aware runahead threads. A: International Conference on Parallel Processing. "38th International Conference on Parallel Processing". Viena: 2009. |
| Títol: | Code semantic-aware runahead threads |
| Autor: | Ramírez García, Tanausu ; Pajuelo González, Manuel Alejandro ; Santana Jaria, Oliverio J. ; Valero Cortés, Mateo  |
| Data: | set-2009 |
| Tipus de document: | Conference report |
| Resum: | Memory-intensive threads can hoard shared re-
sources without making progress on a multithreading processor (SMT), thereby hindering the overall system performance. A recent promising solution to overcome
this important problem in SMT processors is Runa-head Threads (RaT). RaT employs runahead execution to allow a thread to speculatively execute instructions and prefetch data instead of stalling for a long-latency load. The main advantage of this mechanism is that it exploits memory-level parallelism under long latency
loads without clogging up shared resources. As a result, RaT improves the overall processor performance reducing the resource contention among threads.
In this paper, we propose simple code semantic based techniques to increase RaT efficiency. Our proposals are based on analyzing the prefetch opportunities
(usefulness) of loops and subroutines during runahead thread executions. We dynamically analyze these particular program structures to detect when it is useful or not to control the runahead thread execution. By means of this dynamic information, the proposed techniques make a control decision either to avoid or to stall the loop or subroutine execution in runahead threads. Our
experimental results show that our best proposal signifi cantly reduces the speculative instruction execution (33% on average) while maintaining and, even improving the performance of RaT (up to 3%) in some cases. |
| URI: | http://hdl.handle.net/2117/9890 |
| Apareix a les col·leccions: | Altres. Enviament des de DRAC Departament d'Arquitectura de Computadors. Ponències/Comunicacions de congressos CAP - Grup de Computació d´Altes Prestacions. Ponències/Comunicacions de congressos
|
| Comparteix: |
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|