GPU-accelerated sparse matrix-vector product for a hybridizable discontinuous Galerkin method
Visualitza/Obre
Article principal (1019,Kb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/14128
Tipus de documentText en actes de congrés
Data publicació2011
Condicions d'accésAccés restringit per política de l'editorial
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
The iterative solution of the large systems of equations that result from discontinuous
Galerkin (DG) discretizations require the ability to carry out fast matrix-vector products. DG matrices have a sparse block structure with a constant number of non-zero equal-sized non-overlapping blocks per row. General-purpose sparse matrix-vector product algorithms are not designed to exploit the speci c structure of the DG matrices and, as a consequence, result in sub-optimal performance. To address this issue, we propose a sparse matrix-vector product for DG discretizations based on a dense tensor contraction. A GPU implementation of the proposed algorithm for a hybridizable discontinuous Galerkin (HDG) method is
tested on the NVIDIA GEFORCE GTX 285. The results show that the tensor contraction
performs at about 20 to 25 GFLOP/s in double precision with a sustained efficiency of
more than 40% (60 GBytes/s) of the peak memory bandwidth (160 GBytes/s). Moreover,
for HDG matrices in double precision, the proposed method is 2 times faster than the general sparse matrix-vector products provided by the GPU library CUSPARSE and about 30 times faster than MATLAB running on a CPU.
CitacióRoca, X.; Nguyeny, N.; Peraire, J. GPU-accelerated sparse matrix-vector product for a hybridizable discontinuous Galerkin method. A: AIAA Aerospace Sciences Meeting including the New Horizons Forum and Aerospace Exposition. "49th AIAA Aerospace Sciences Meeting including the New Horizons Forum and Aerospace Exposition". Orlando, Florida: 2011, p. 1-12.
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
RocaNguyenPeraireAIAA2011.pdf | Article principal | 1019,Kb | Accés restringit |