Reduction to tridiagonal form for symmetric eigenproblems on asymmetric multicore processors
Visualitza/Obre
3026937.3026938.pdf (1,185Mb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Cita com:
hdl:2117/362108
Tipus de documentText en actes de congrés
Data publicació2017
EditorAssociation for Computing Machinery (ACM)
Condicions d'accésAccés restringit per política de l'editorial
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Asymmetric multicore processors (AMPs), as those present in ARM big.LITTLE technology, have been proposed as a means to address the end of Dennard power scaling law. The idea of these architectures is to activate only the type (and number) of cores that satisfy the quality of service requested by the application(s) in execution while delivering high energy efficiency. For dense linear algebra problems though, performance is of paramount importance, asking for an efficient use of all computational resources in the AMP. In response to this, we investigate how to exploit the asymmetric cores of an ARMv7 big.LITTLE AMP in order to attain high performance for the reduction to tridiagonal form, an essential step towards the solution of dense symmetric eigenvalue problems. The routine for this purpose in LAPACK is especially challenging, since half of its floating-point arithmetic operations (flops) are cast in terms of compute-bound kernels while the remaining half correspond to memory-bound kernels. To deal with this scenario: 1) we leverage a tuned implementation of the compute-bound kernels for AMPs; 2) we develop and parallelize new architecture-aware micro-kernels for the memory-bound kernels; 3) and we carefully adjust the type and number of cores to use at each step of the reduction procedure.
CitacióAlonso, P. [et al.]. Reduction to tridiagonal form for symmetric eigenproblems on asymmetric multicore processors. A: ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. "Proceedings of the Eighth International Workshop on Programming Models and Applications for Multicores and Manycores, PMAM 2017: February 5, 2017, Austin, Texas, USA". New York: Association for Computing Machinery (ACM), 2017, p. 39-47. ISBN 978-1-4503-4883-6. DOI 10.1145/3026937.3026938.
ISBN978-1-4503-4883-6
Versió de l'editorhttps://dl.acm.org/doi/10.1145/3026937.3026938
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
3026937.3026938.pdf | 1,185Mb | Accés restringit |