Mostra el registre d'ítem simple
Operación stencil en plataformas multi-core y many-core
dc.contributor | Herrero Zaragoza, José Ramón |
dc.contributor.author | Garcés Chapero, Bernardo |
dc.contributor.other | Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors |
dc.date.accessioned | 2011-07-07T11:38:05Z |
dc.date.available | 2011-07-07T11:38:05Z |
dc.date.issued | 2011-06-29 |
dc.identifier.uri | http://hdl.handle.net/2099.1/12453 |
dc.description.abstract | Catellano: Los problemas derivados de la disipación de energía en la computación secuencial, están haciendo que cada vez se popularice más el uso de máquinas y sistemas con mayor cantidad de núcleos de proceso. Pasando desde pequeños procesadores con un número reducido de núcleos, por clusters con varias máquinas secuenciales distribuidas, e incluso por dispositivos de procesamiento gráfico (GPUs) con varios cientos de núcleos que permiten asignar tareas generales a estos, muchos algoritmos están siendo adaptados a estos modelos de paralelización. Resumen En este trabajo se ha llevado a cabo el análisis, implementación, optimización y paralelización de las operaciones stencil de 5 puntos y 27 puntos, que son operaciones cuyo origen es la resolución de ecuaciones en derivadas parciales mediante un método finito y que tienen una importancia significativa en el campo de la ciencia. La paralelización se ha llevado a cabo tanto en un sistema multi-core con dos procesadores Intel Xeon E5520, como utilizando un dispositivo gráfico Nvidia GeForce GTX 295 con 240 núcleos CUDA. Resumen En cuanto a la optimización del algoritmo, se han aplicado al cálculo una serie de optimizaciones al código secuencial tales como desenrollado de bucles, eliminación de subexpresiones comunes o vectorizaciones mediante instrucciones SSE. Resumen Para la paralelización en el entorno multi-core, y con el fin de poder explotar todos los recursos hardware del sistema, se han probado diferentes modelos de programación paralela, tanto basados en sistemas de memoria distribuida como MPI, como basados en sistemas de memoria compartida como OpenMP y POSIX Threads. Resumen En cuanto a la implementación en el entorno many-core, se han utilizado dos formas diferentes de enfocar la resolución del problema, una de ellas empleando el método que a simple vista parece más práctico para la resolución, y la otra creando una estructuración de las tareas más apropiado para la arquitectura utilizada. La diferencia de rendimiento de ambas versiones es de un 20% en el caso del stencil de 5 puntos y de un 80% en el de 27 puntos, en ambos casos a favor de la segunda versión del algoritmo. Resumen Finalmente, los resultados de las optimizaciones han sido diferentes dependiendo de la operación implementada, para el stencil de 5 puntos se ha podido conseguir un Speed Up de 5.41x en el entorno multi-core y de 15.95x en el entorno many-core. Para el stencil de 27 puntos, el Speed Up ha sido de 13.9x en el entorno multi-core y de 146.97x en el entorno many-core. |
dc.language.iso | spa |
dc.publisher | Universitat Politècnica de Catalunya |
dc.subject | Àrees temàtiques de la UPC::Informàtica::Hardware |
dc.subject.lcsh | Multiprocessors |
dc.subject.other | Stencil |
dc.subject.other | GPU |
dc.subject.other | Multi-core |
dc.subject.other | Many-core |
dc.subject.other | MPI |
dc.subject.other | Open MP |
dc.subject.other | Pthreads |
dc.subject.other | Cuda |
dc.subject.other | Procesadores Intel Xeon E5520 |
dc.subject.other | Dispositivo gráfico Nvidia GeForce GTX 295 |
dc.title | Operación stencil en plataformas multi-core y many-core |
dc.type | Master thesis (pre-Bologna period) |
dc.subject.lemac | Multiprocessadors |
dc.identifier.slug | 72537 |
dc.rights.access | Open Access |
dc.date.updated | 2011-07-05T22:35:57Z |
dc.audience.educationlevel | Estudis de primer/segon cicle |
dc.audience.mediator | Facultat d'Informàtica de Barcelona |
dc.audience.degree | ENGINYERIA INFORMÀTICA (Pla 2003) |