Ficha - Artículo

Uniform Resource Locator-URL: www.cyta.com.ar/ta1502/v15n2a4.htm

 

 

Título:

Medición de rendimiento del algoritmo spmv utilizando contadores de hardware para GP GPU en arquitecturas no homogéneas

Title:

 

Autoría - Creator:

Waldo, Valiente / Díaz, Federico / De Luca, Graciela / Giulianelli, Daniel A. /

Resumen:

En la presente investigación se busca analizar diferentes contadores de hardware durante la ejecución del algoritmo SPMV (multiplicación vector por matriz dispersa), a través del uso de herramientas de profiling utilizadas en placas gráficas de los fabricantes ATI y NVIDIA. Utilizando como base tres bibliotecas que hacen uso del procesador gráfico, se busca inferir a partir del estudio de los diferentes indicadores, las optimizaciones aplicables en el contexto planteado que mejoren el desempeño. Para analizar los resultados, se propuso una división de los tres principales eventos de la arquitectura (escritura, ejecución y lectura). Se trabajó en el análisis de las notorias diferencias detectadas en los tiempos de respuestas debido al volumen de las transferencias de datos, para luego analizar la implementación de una biblioteca en particular para cada arquitectura hardware. Finalmente se propone una pequeña modificación que logra mejorar el rendimiento de ambas arquitecturas.

Abstract:

 
 

Palabras Clave:

GPU, CUDA, OpenCL

Keyword:

Contadores de hardware, ,

 
 
 
 

Bibliografía - Bibliography:

Blas, 2015. BLAS (Basic Linear Algebra Subprograms)

Boost, 2015. Biblioteca Boost lenguaje C++

Cise, 2015. Repositorio de Matrices Dispersas

De Luca et al, 2015. Análisis de rendimiento de algoritmos de resolución de problemas de matrices dispersas para GP-GPU Computing mediante el uso de profiling de hardware. Universidad Nacional de la Matanza, WICC 2015, pp2-3.

Duff et al, 1997. The Rutherford-Boening Sparse Matrix Collection. Atlas Centre, Departament for Computation and Information, pp19-29.

Golub y Van Loan, 2013. Matrix computation. The Johns Hopkins University, Fourth Edition, pp 33-42.

Khronos, 2015. OpenCL: Spec, OpenCL 1.2 API and C Language Specification. Khronos OpenCL Working Group,Document Revision: 19, pp 22-30. 

Haque, 2002. A Computational Study Of Sparse Matrix Storage Schemes. Bachelor of Science, Islamic University of Technology, pp. 197–204.

Kaltofen, 2014. The Seven Dwarfs of Symbolic Computation. Dept. of Mathematics, North Carolina State University, pp 2,3.

Lien, 2012. Auto-tunable GPU BLAS. Norwegian University of Science and Technology, Department of Computer and Information Science, pp 6-22.

Liu y Vinter, 2014. An Efficient GPU General Sparse Matrix-Matrix Multiplication for Irregular Data. IEEE 28th International Parallel y Distributed Processing Symposium, pp 370-381.

Neelima y Raghavendra, 2012. Effective Sparse Matrix Representation for the GPU Architectures. National Institute of Technology, Karnataka, pp 3-6.

Magma, 2014. Biblioteca BLAS Magma

Market, 2013. Formato Matrix Market

Matlab, 2015. Formato Matlab

Nvidia, 2015. “CUDA™ C Programming Guide version 5.0”: NVIDIA Corporation, pp 7-80.

Paralution, 2015. Biblioteca BLAS Paralution

ViennaCL, 2015. Biblioteca BLAS ViennaCL

 
 
 
 

Publicación - Publisher: Técnica Administrativa ISSN 1666-1680

Volumen: 15, Número - Number: 2; [ISSUE:66]

Fecha de publicación - Publication date: 15-04-2016

URL: www.cyta.com.ar/ta1502/v15n2a4.htm

XML: Registro en XML

 
 

Citas del Artículo Citas de este artículo en Google Scholar

   
 
 
 

Revista: Técnica Administrativa - ISSN 1666-1680

Editorial: Ciencia y Técnica Administrativa - CyTA

email: cyta@cyta.com.ar