一种基于图形处理单元的影响最大化并行加速方法技术

技术编号：8078991 阅读：204 留言：0更新日期：2012-12-13 21:52

本发明专利技术公开了一种基于图形处理单元的影响最大化并行加速方法，目的是提出一种新型基于GPU的影响最大化并行方法，利用GPU的并行计算能力加速算法执行、减少执行时间。其特征在于在每次蒙特卡洛模拟中，首先找到网络图中的强连通分量，将同一强连通分量中的所有节点合并为一个节点，其权重为该强连通分量中各节点权重之和；然后采用自底向上遍历的策略，并行计算各节点的影响值；利用GPU的并行计算能力，由各个GPU计算核心采用各自的线程对不同的节点并行计算影响值，得到K个最有影响的节点。本发明专利技术将图转化为有向无环图，可以显著减少影响值的计算量，同时通过最大程度地调度各节点在GPU的计算核心中并行计算，降低了整体运行时间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及海量数据挖掘领域中社会网络影响最大化问题的解决方法，尤其指针对大規模社会网络的海量用户挖掘，提出的一种基于图形处理单元GPU的并行加速方法。
技术介绍
Web2. O技术的快速发展推动了社会媒体的蓬勃发展。各类社交网站不断涌现，例如国外的Facebook、Twitter以及国内的人人网、新浪微博等网站用户数量增长十分迅速，当前Facebook的活跃用户已经超过了 8. 5亿。社交网站不仅是人们沟通和交流的桥梁，同时还成了信息传播和扩散的重要媒介。研究表明，68%的顾客会在购买产品之前询问其家人、朋友的意见。病毒式营销(Viral Marketing)正是利用了用户之间口碑传播的原理,进行品牌推广等网络传销方法。而且随着社会网络用户的持续快速增长，病毒式营销已经成为ー种十分高效的信息传播方式。影响最大化问题是社会网络分析中关于影响传播的经典问题。设想如下场景一家公司要进行新产品推广，其推广策略是选择K名顾客免费试用新产品，之后利用这K名顾客对产品的宣传推广和影响传播吸引更多的顾客购买新产品，从而达到利益最优的目的。影响最大化问题可以形式化描述为对于社会网络图G = (V，E，W)，其中V = {v0,V1, , vn_J是节点集合，V中节点个数为η ；Ε是节点集合V中节点之间的有向边集合，即E czV xV,^中有向边的条数为m ;评是G中节点权重的集合，表征了各节点的影响カ(初始值设定为1，即仅能影响节点自身)。给定网络图G和初始活跃节点集合中的节点个数K，影响最大化问题是从节点集合V中选择最佳的K个节点作为初始活跃节点集合S，通过影响传...

【技术保护点】
一种基于图形处理单元的影响最大化并行加速方法，包括以下步骤：第一步：初始化影响最大化节点集合S为空；第二步：设定当前蒙特卡洛模拟次数Num=0；第三步：采用蒙特卡洛模拟方法对图进行选边，得到图G′；其特征在于还包括以下步骤：第四步：采用Tarian算法，基于深度优先搜索寻找图G′中所有的强连通分量SCCi，i取值从0到j？1，i为图G′中的强连通分量的个数；第五步：根据图G′的各强连通分量SCCi，将图G′转变为有向无环图G*，方法是：5.1：初始化i=0；5.2：将强连通分量SCCi用新节点vn+i代替，其中n是图G′中的节点个数；5.3：i=i+1，如果i未被访问，将数组Visited[]全部初始化为false，表示所有节点均未被访问；6.1.2：使用整数数组Count[]记录各个节点已经被访问的子节点个数，其中0≤Count[vx]≤outdegree[vx]，0≤x≤n？1，outdegree[vx]是节点vx的出度；将数组Count[]全部初始化为0，表示均未被访问；6.1.3：使用整数数组Inf[]记录各个节点的影响值，其中0≤，Inf[vx]≤n，0≤x≤n？1，将数组Inf[]全部初始化为0；6.1.4：使用字符串数组Label[]记录各个节点的标签，标签Label[vx]标记了节点vx可能同其他节点发生重叠的位置，其中节点va及节点vb重叠于节点vc当且仅当从节点va和vb均存在至少一条路径可达节点vc，0≤a，b，c≤n？1，将数组Label[]全部初始化为NULL；6.1.5：使用布尔变量Stop记录线程计算是否完成，Stop等于true表示该次模拟中所有节点影响值计算已经完成，Stop等于false表示未完成，Stop为全局变量，所有GPU线程均可以修改其内容，初始化Stop为false；6.2：如果停止标志Stop为false，转6.3；如果Stop为true，转第七步；6.3：GPU采用单指令流多数据流的执行方式，以多线程并行的方式计算节点的影响值；多线程并行的方式是指：GPU为每个节点分配一个线程计算影响值，GPU一次由v个线程并行计算y个节点的影响值，y为GPU中的流处理器数目，当GPU当前y个节点的影响值计算完成后，若还有节点影响值未计算，则GPU经过GPU线程调度以多线程并行的方式计算剩余节点的影响值，直至所有节点的影响值计算完毕，GPU的一个线程计算节点vp影响值的方法是：6.3.1：将停止标志Stop置为true；6.3.2：如果Visited[vp]等于false，执行6.3.3；否则说明节点vp已经被访问过，转6.2；6.3.3：如果Count[vp]等于节点vp的出度，则说明节点vp的所有子节点均己被访问，执行6.3.4计算节点vp的影响值；否则说明节点vp的子节点中仍有未处理的节点，则将停止标志Stop置为false，转6.2；6.3.4：计算节点vp的所有子节点影响值的总和sum，其中out[vp]是节点vp所有子节点的集合；6.3.5：计算节点vp的标签Label(vp)，节点vp的标签label(vp)等于节点vp的所有子节点对vp贡献的并集，即其中Con(vq)是子节点vq对节点vp的贡献，子节点vq对节点vp的贡献是指：如果子节点vq的入度大于1，则vq对节点vp的贡献为节点vq自身，即Con(vq)＝vq；如果子节点vq的入度小于等于1，vq的贡献为节点vq的标签，即Con(vq)＝Label(vq)；6.3.6：计算节点vp所有子节点的集合out[vp]重叠的影响值Overlap(out[vp])，方法是：6.3.6.1：初始化Overlap(out[vp])为O，初始化重叠范围集合Range为out[vp]；6.3.6.2：对于任意节点va∈Range，如果存在节点vb∈Range且vb≠va，并且从节点va存在路径可达节点vb，此时重叠发生在节点vb，故Overlap(out[vp])＝Overlap(out[vp])+Inf[vb...

【技术特征摘要】

【专利技术属性】
技术研发人员：李姗姗，廖湘科，刘晓东，吴庆波，戴华东，彭绍亮，王蕾，付松龄，鲁晓佩，郑思，
申请(专利权)人：中国人民解放军国防科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人