Modeling and optimizing NUMA effects and prefetching with machine learning
Visualitza/Obre
Cita com:
hdl:2117/192494
Tipus de documentText en actes de congrés
Data publicació2020
EditorAssociation for Computing Machinery (ACM)
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Both NUMA thread/data placement and hardware prefetcher configuration have significant impacts on HPC performance. Optimizing both together leads to a large and complex design space that has previously been impractical to explore at runtime. In this work we deliver the performance benefits of optimizing both NUMA thread/data placement and prefetcher configuration at runtime through careful modeling and online profiling. To address the large design space, we propose a prediction model that reduces the amount of input information needed and the complexity of the prediction required. We do so by selecting a subset of performance counters and application configurations that provide the richest profile information as inputs, and by limiting the output predictions to a subset of configurations that cover most of the performance. Our model is robust and can choose near-optimal NUMA+Pre-fetcher configurations for applications from only two profile runs. We further demonstrate how to profile online with low overhead, resulting in a technique that delivers an average of 1.68X performance improvement over a locality-optimized NUMA baseline with all prefetchers enabled.
CitacióSánchez Barrera, I. [et al.]. Modeling and optimizing NUMA effects and prefetching with machine learning. A: International Conference on Supercomputing. "Proceedings of the 34th ACM International Conference on Supercomputing (ICS-2020): Barcelona, June 29–July 2, 2020". New York: Association for Computing Machinery (ACM), 2020, article 34, p. 1-13.
ISBN978-1-4503-7983-0
Versió de l'editorhttps://dl.acm.org/doi/10.1145/3392717.3392765
Col·leccions
- Doctorat en Arquitectura de Computadors - Ponències/Comunicacions de congressos [294]
- Computer Sciences - Ponències/Comunicacions de congressos [574]
- CAP - Grup de Computació d'Altes Prestacions - Ponències/Comunicacions de congressos [784]
- Departament d'Arquitectura de Computadors - Ponències/Comunicacions de congressos [1.955]
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
3392717.3392765.pdf | Versió publicada pel l'editor. En accés obert a ACM DL | 1,211Mb | Visualitza/Obre |