【技术实现步骤摘要】
一种降低高性能计算内存功耗的装置及其使用方法
[0001]本专利技术涉及一种降低高性能计算内存功耗的装置及其使用方法,属于内存功耗计算
技术介绍
[0002]高性能计算技术是国家战略高科技技术,是解决经济建设、社会发展、科学进步、国家安全一系列重大挑战性问题的重要手段,已经成为信息时代世界各国的战略技术制高点。今天我国经济社会发展和国家安全对高性能计算具有迫切需求;如解决能源短缺、环境污染、全球气候变化等重大挑战问题迫切需求高性能计算,高性能计算机正在国民经济各个领域发挥着不可替代的作用,已经成为研究和解决各领域挑战性问题的重要手段。
[0003]中国专利申请(公开号为CN105607726A)公开一种降低高性能计算集群内存功耗的方法及装置,该专利中利用多个模块对高性能计算集群作业实时监控、分析,确定高性能计算集群目前运行的作业类型的内存容错机制,并根据内存容错机制的容错级别来对高性能计算集群的内存功耗进行分配,从而依据容错级别来调整内存功耗,降低内存功耗,在保持集群性能不变的前提下提高能耗比,但是其内部的 ...
【技术保护点】
【技术特征摘要】
1.一种降低高性能计算内存功耗的装置,其特征在于:包括计算模块、监测模块、分析模块和分配模块;计算模块:包括多个众核协处理器和高性能内存单元,多个众核协处理器采用异构架构,高性能内存单元存储需要计算的数据,多个众核协处理器借助高性能内存单元对数据进行实时计算和处理,众核协处理器采用CPU+GPU的异构架构,实现并行处理功能,CPU负责复杂的逻辑计算部分,GPU负责并行度高、分支少的密集运算,并将多个众核协处理器运用于大规模深度神经网络的训练,通过CHAOS的并行框架完成众核协处理器的线程并行操作;监测模块:包括资源管理单元、预警单元和数据传输单元,资源管理单元用于实时检测计算模块中高性能计算的运行情况,当高性能计算出现故障时,预警单元会亮灯预警并停止计算模块的工作,数据传输单元在计算模块正常工作时将计算得到的数据送至分析模块;分析模块:包括多个算法单元,多个算法单元分成多组执行不同的算法对监测模块传输的数据进行计算,其中部分算法单元使用宽度优先搜索算法,用位图的数据结构表示宽度优先搜索算法中的访问者结构,用从下到上的搜索方式,并通过结合从上到下与从下到上的搜索方法,多个算法单元还具备内存绑定和线程绑定的优化技术,并对传入的数据进行划分,分析完毕后将分析结果送至分配模块中;分配模块:包括主节点管理器、消息管理单元、从节点执行器和共享存储单元,主节点管理器提供任务编排定义和调度的功能,将接收的分析结果定义成需要运行的任务抛给消息管理单元;然后,运行在不同资源环境的从节点执行器从消息管理单元中监控自己需要执行的任务,当需要从节点执行器执行的任务出现,对应的从节点执行器就执行相应的任务;最后从节点执行器将需要输入和输出的文件都存储在一个共享存储单元中。2.根据权利要求1所述的一种降低高性能计算内存功耗的装置,其特征在于:所述计算模块中CHAOS的并行框架采用HogWild方法将梯度累积存储在计算模块本体中,利用worker更新全局的权重参数。3.根据权利要求2所述的一种降低高性能计算内存功耗的装置,其特征在于:所述资源管理单元使用统一的底层资源管理框架,在底层资源管理框架之上迁移和安装不同的应用框架。4.根...
【专利技术属性】
技术研发人员:甘润东,龙玉江,王策,卫薇,李洵,卢仁猛,钟掖,王杰峰,陈卿,袁捷,孙骏,
申请(专利权)人:贵州电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。