一种基于GPU集群的深度优先算法设计与实现

首页 > 成果 > 详情

认领

导出

Link by 万方会议论文

反馈

作者信息关键词期刊信息会议信息归属信息摘要

成果类型：

会议论文

论文标题(英文)：

Implementation of Depth First Search Algorithm on Cluster of GPUs

作者：

余莹;李肯立;郑光勇

作者机构：

衡阳师范学院计算机科学系,湖南省衡阳市 421002

湖南大学信息科学与工程学院,湖南省长沙市 410082

语种：

中文

关键词：

深度优先搜索(DFS);分布式算法

关键词(英文)：

GPU;CUDA;MPI

年：

2013

页码：

895-895

会议名称：

2013全国高性能计算学术年会

会议论文集名称：

2013全国高性能计算学术年会论文集

会议时间：

2013-10-29

会议地点：

桂林

会议赞助商：

中国计算机学会

机构署名：

本校为第一机构

摘要：

　　深度优先搜索算法在GPU集群中大型图上的简单执行，会导致线程间的负载不平衡和无法合并内存访问的情况，使得算法的性能较低.为了获得在单个GPU和多个GPU环境下性能的明显提高，在处理数据之前通过采取一系列有效的操作进行重新编排.提出了构造线程和数据之间映射的新技术，通过利用前缀求和及二分查找操作来达到完美的负载平衡.为了降低通信开销，对DFS各分支中需要进行交换的边集执行修剪操作.实验结果表明，算法在单个GPU上可以尽可能地实现最佳的并行性，在多GPU环境下可以最小化通信开销.在一个GPU集群中，可以对含有数十亿节点的图有效地执行分布式DFS.

摘要(英文)：

　　Straightforward implementation of Depth First Search algorithm for large graph on GPU cluster,may lead to load imbalance between threads and un-coalesced memory accesses,giving rise to the low performance of the algorithm.In order to achieve improvement of the performance in a single GPU and multi-GPUs environment,a series of effective operations were used to reschedule before processing the data.A novel strategy for mapping between threads and data was proposed,by using the prefix sum and binary search operations to achieve perfect load ba...

反馈

产权有误：本人成果被他人认领

数据有误：数据基本信息有误

归属有误：成果的院系归属、机构署名归属有误

其他原因：

验证码：

看不清楚，换一个

确定

取消

成果认领

标题：

用户	作者	通讯作者	--
	请选择	请选择	--

确定

取消

一种基于GPU集群的深度优先算法设计与实现

反馈

成果认领

提示

该栏目需要登录且有访问权限才可以访问