|
E-prints UPC >
Altres >
Enviament des de DRAC >
Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/2117/14128
|
Ítem no disponible en accés obert per política de l'editorial
| Arxiu |
Descripció |
Mida | Format |
| RocaNguyenPeraireAIAA2011.pdf | Article principal | 1.02 MB | Adobe PDF |  |
|
| Citació: | Roca, X.; Nguyeny, N.; Peraire, J. GPU-accelerated sparse matrix-vector product for a hybridizable discontinuous Galerkin method. A: AIAA Aerospace Sciences Meeting including the New Horizons Forum and Aerospace Exposition. "49th AIAA Aerospace Sciences Meeting including the New Horizons Forum and Aerospace Exposition". Orlando, Florida: 2011, p. 1-12. |
| Títol: | GPU-accelerated sparse matrix-vector product for a hybridizable discontinuous Galerkin method |
| Autor: | Roca Navarro, Francisco Javier ; Nguyeny, N.C.; Peraire Guitart, Jaume  |
| Data: | 2011 |
| Tipus de document: | Conference report |
| Resum: | The iterative solution of the large systems of equations that result from discontinuous
Galerkin (DG) discretizations require the ability to carry out fast matrix-vector products. DG matrices have a sparse block structure with a constant number of non-zero equal-sized non-overlapping blocks per row. General-purpose sparse matrix-vector product algorithms are not designed to exploit the speci c structure of the DG matrices and, as a consequence, result in sub-optimal performance. To address this issue, we propose a sparse matrix-vector product for DG discretizations based on a dense tensor contraction. A GPU implementation of the proposed algorithm for a hybridizable discontinuous Galerkin (HDG) method is
tested on the NVIDIA GEFORCE GTX 285. The results show that the tensor contraction
performs at about 20 to 25 GFLOP/s in double precision with a sustained efficiency of
more than 40% (60 GBytes/s) of the peak memory bandwidth (160 GBytes/s). Moreover,
for HDG matrices in double precision, the proposed method is 2 times faster than the general sparse matrix-vector products provided by the GPU library CUSPARSE and about 30 times faster than MATLAB running on a CPU. |
| URI: | http://hdl.handle.net/2117/14128 |
| Apareix a les col·leccions: | Altres. Enviament des de DRAC Departaments de Matemàtica Aplicada. Ponències/Comunicacions de congressos LaCàN - Laboratori de Càlcul Numèric. Ponències/Comunicacions de congressos
|
| Comparteix: |
|
Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).
Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu
|