Decomposição de multiplicação matricial em tarefas adequadas a ambientes heterogêneos baseados em GPGPU

Silva, Ricardo Inácio Álvares e

Decomposição de multiplicação matricial em tarefas adequadas a ambientes heterogêneos baseados em GPGPU

dataload.collectionmapped	02 - Mestrado - Ciência da Computação	pt_BR
dataload.filenamenourau	2347.pdf	pt_BR
dataload.handlemapped	123456789/50	pt_BR
dataload.idpergamum	160580	pt_BR
dataload.idvirtuanourau	vtls000182263	pt_BR
dataload.idvirtuapergamum	vtls000182263	pt_BR
dataload.idvirtuapergamum.sameurlnourau	SIM	pt_BR
dataload.linknourau	http://www.bibliotecadigital.uel.br/document/?code=vtls000182263	pt_BR
dataload.linknourau.regular	SIM	pt_BR
dataload.linknourau.retificado	http://www.bibliotecadigital.uel.br/document/?code=vtls000182263	pt_BR
dataload.linknourau.size	64.00	pt_BR
dc.contributor.advisor	Brancher, Jacques Duílio [Orientador]	pt_BR
dc.contributor.author	Silva, Ricardo Inácio Álvares e	pt_BR
dc.contributor.banca	Zarpelão, Bruno Bogaz	pt_BR
dc.contributor.banca	Attrot, Wesley	pt_BR
dc.contributor.banca	Romeiro, Neyva Maria Lopes	pt_BR
dc.coverage.spatial	Londrina	pt_BR
dc.date.accessioned	2024-05-01T14:19:05Z
dc.date.available	2024-05-01T14:19:05Z
dc.date.created	2013.00	pt_BR
dc.date.defesa	20.02.2013	pt_BR
dc.description.abstract	Resumo: Este trabalho desenvolve dois algoritmos para decomposição de multiplicação matricial geral (GEMM, do inglês General Matrix Multiplication) em tarefas menores, adequadas à distribuição entre processadores disponíveis em sistemas heterogêneos, como CPUs e GPUs, que têm como objetivo a escalabilidade de desempenho Um dos algoritmos gera tarefas que são multiplicações matriciais menores, independentes entre si, mas com redundância de dados nas transferências entre os processadores O trabalho mostra que esse algoritmo também pode ser utilizado para explorar recursos de GPUs como a sobreposição de operações de transferências e execução de kernels Já o outro algoritmo decompõe multiplicações matriciais em três grupos de tarefas, sendo dois de multiplicações menores e um de somas vetoriais Demonstra-se que apesar das tarefas possuírem independência apenas parcial, podem ser organizadas de tal forma a serem resolvidas concorrentemente Este algoritmo também prevê a viabilidade de redução nas transferências de memória entre os processadores e evita redundância nas transferências de dados O trabalho ainda mostra que tais características são desejáveis para sistemas computacionais heterogêneos baseados em computação de propósito geral na unidade de processamento gráfico (GPGPU, do inglês General Purpose computing on GPU) Por fim, o trabalho apresenta implementações dos algoritmos propostos e seus respectivos desempenhos A experimentação mostra que, em um sistema com duas GPUs, os algoritmos podem melhorar o desempenho de multiplicações em 5%, para matrizes de dimensão 1?1, até acima de 1%, para 4?4 adiante	pt_BR
dc.description.abstractother1	Abstract: In this work, we developed two algorithms for decomposing a general matrix multiplication (GEMM) into smaller tasks, adequate to distribution between available processors in heterogeneous systems, such as CPUs and GPUs, that have performance scalability as its main objective One of the algorithms generates independent smaller matrix multiplication tasks, but with redundancy in data transfers between processors We show that this algorithm can utilize GPUs features such as overlapping of memory transfers and kernel executions The other algorithm presented decomposes matrix multiplications in three groups of tasks, two being smaller multiplications and, the other, vectorial sums We show that although the independence of these tasks being only partial, they can be organized in such a way that are able to be solved concurrently This algorithm also provides reduction in memory transfers between processors and avoids redundancy We also show that such features are desirable in heterogeneous systems based in general purpose computing in GPU (GPGPU) Finally, we show implementations to the proposed algorithms and their respective performance Experimentation shows that, in a system with two GPUs, they can improve matrix multiplication performance by 5%, for matrix dimensions from 1?1, up to over 1%, for 4?4 and on	pt_BR
dc.description.notes	Dissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.identifier.uri	https://repositorio.uel.br/handle/123456789/13806
dc.language	por
dc.relation.coursedegree	Mestrado	pt_BR
dc.relation.coursename	Ciência da Computação	pt_BR
dc.relation.departament	Centro de Ciências Exatas	pt_BR
dc.relation.ppgname	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.subject	Programação paralela (Computação)	pt_BR
dc.subject	Processamento paralelo (Computadores)	pt_BR
dc.subject	Álgebra linear	pt_BR
dc.subject	Processamento de dados	pt_BR
dc.subject	Sistemas operacionais distribuídos (Computadores)	pt_BR
dc.subject	Parallel programming (Computer science)	pt_BR
dc.subject	Parallel processing (Electronic computers)	pt_BR
dc.subject	Algeb	pt_BR
dc.title	Decomposição de multiplicação matricial em tarefas adequadas a ambientes heterogêneos baseados em GPGPU	pt_BR
dc.type	Dissertação	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: 2347.pdf
Tamanho:: 1.9 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

02 - Mestrado - Ciência da Computação