一种GPU上基于内存统一管理的MapReduce实现方法技术

技术编号：9906907 阅读：278 留言：0更新日期：2014-04-11 05:49

本发明专利技术公开了一种GPU上基于内存统一管理的MapReduce实现方法，包括：初始化GPU的块大小为Bs，每个块中的线程数目N，输入数据量大小M；在全局内存上为GPU的每个块分配一个中间数据缓冲区，同时分配一个全局结果缓冲区；对p%的输入数据进行预处理，在中间数据缓冲区中收集map任务计算结果和归约频率信息；根据键值对的归约频率，对中间结果进行排序，保存键值对索引信息到排序结果缓冲区sort_index[]中；初始化GPU每个块对应的中间数据缓冲区为零，在共享内存中建立内存分配区sm_pool[]；设置内存分配标记数组mem_flag[]。本发明专利技术在每个GPU块的中间数据缓冲区中，对全局内存和共享内存资源进行统一管理，减少了内存资源开销，避免了分开管理导致的键值对对重复查找和map任务重复计算开销。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了，包括：初始化GPU的块大小为Bs，每个块中的线程数目N，输入数据量大小M；在全局内存上为GPU的每个块分配一个中间数据缓冲区，同时分配一个全局结果缓冲区；对p%的输入数据进行预处理，在中间数据缓冲区中收集map任务计算结果和归约频率信息；根据键值对的归约频率，对中间结果进行排序，保存键值对索引信息到排序结果缓冲区sort_index；设置内存分配标记数组mem_flag[]。本专利技术在每个GPU块的中间数据缓冲区中，对全局内存和共享内存资源进行统一管理，减少了内存资源开销，避免了分开管理导致的键值对对重复查找和map任务重复计算开销。【专利说明】—种GPU上基于内存统一管理的MapReduce实现方法
本专利技术属于计算机高性能计算领域，更具体地，涉及。
技术介绍
近年来，随着并行计算的发展，传统上只用于处理图形渲染计算任务的GPU逐渐被用于通用计算领域。相对于CPU，GPU在大规模数据并行处理方面具有强大的优势且性价比较高，可以弥补CPU性能不足的应用场景。为了充分利用GPU这种众核处理器的性能，需要编写适合其体系结构的并行程序。而GPU的硬件结构和传统多核CPU差别较大，内存层次比CPU复杂，且使用便签式存储器(Scratchpad Memory,简称SPM)这类不同于CPU上Cache机制的硬件设计，导致GPU编程与传统的串行编程有较大的区别，具有一定编程难度。为了解决这个问题，学术界提出将分布式计算中的MapReduce编程模型移植到GPU，以简化编程方式。MapReduce只向上层应用开发提供简单的接口，而...

【技术保护点】
一种GPU上基于内存统一管理的MapReduce实现方法，其特征在于，包括以下步骤：?（1）初始化GPU中块的数量Bs、每个块中的线程数目N、以及用户的输入数据量大小M；?（2）为每个块在全局内存上分配中间数据缓冲区，对map计算生成的键值对进行连续的归约操作，通过在键值对的值中设置归约次数和在计算中不断累计，统计键值对出现的频率信息，并根据出现频率对键值对进行排序，提取出高频的键值对；?（3）将步骤（2）得到的高频键值对插入到共享内存中，在任务处理中，通过使用标记数组对全局内存和共享内存的分配进行统一管理，且只有当共享内存资源使用完毕之后，才开始在全局内存中分配空间。

【技术特征摘要】

【专利技术属性】
技术研发人员：金海，郑然，刘凯，章勤，冯晓文，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人