Vectorized register tiling
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/16308
Tipus de documentReport de recerca
Data publicació2012-01
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
In the last years, there has been much effort in commercial compilers (icc, gcc) to exploit efficiently the SIMD capabilities and the memory hierarchy that the current processors offer. However, the small numbers of compilers that can automatically exploit these characteristics achieve in most cases unsatisfactory results. Therefore, the programmers often need to apply by hand the optimizations to the source code, write manually the code in assembly or use compiler built-in functions (such intrinsics) to achieve high performance. In this work, we present source-to-source transformations that help commercial compilers exploiting the memory hierarchy and generating efficient SIMD code. Results obtained on our experiments show that our solutions achieve as excellent performance as hand-optimized vendor-supplied numerical libraries (written in assembly).
CitacióBerna, A.; Jimenez, M.; Llaberia, J. "Vectorized register tiling". 2012.
Forma partUPC-DAC-RR-CAP-2012-4
URL repositori externhttps://www.ac.upc.edu/app/research-reports/html/2012/5/abstractAndPoster.pdf
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
VECTORIZED REGISTER TILING.pdf | 909,0Kb | Visualitza/Obre |