一种降低高性能计算内存功耗的装置及其使用方法制造方法及图纸

技术编号:36692631 阅读:15 留言:0更新日期:2023-02-27 20:01
本发明专利技术公开了一种降低高性能计算内存功耗的装置及其使用方法,涉及高性能计算技术领域,具体包括,计算模块:多个众核协处理器借助高性能内存单元对数据进行实时计算和处理;监测模块:在计算模块正常工作时将计算得到的数据送至分析模块;分析模块:多个算法单元分成多组执行不同的算法对监测模块传输的数据进行计算;分配模块:运行在不同资源环境的从节点执行器从消息管理单元中监控自己需要执行的任务。本发明专利技术针对计算模块中的数据都可以有效搜索,提高计算精准度,方便将不同的计算数据融合到统一的共享存储单元中,每种数据都有适合自己的计算环境,有效减少了装置的功耗。有效减少了装置的功耗。有效减少了装置的功耗。

【技术实现步骤摘要】
一种降低高性能计算内存功耗的装置及其使用方法


[0001]本专利技术涉及一种降低高性能计算内存功耗的装置及其使用方法,属于内存功耗计算


技术介绍

[0002]高性能计算技术是国家战略高科技技术,是解决经济建设、社会发展、科学进步、国家安全一系列重大挑战性问题的重要手段,已经成为信息时代世界各国的战略技术制高点。今天我国经济社会发展和国家安全对高性能计算具有迫切需求;如解决能源短缺、环境污染、全球气候变化等重大挑战问题迫切需求高性能计算,高性能计算机正在国民经济各个领域发挥着不可替代的作用,已经成为研究和解决各领域挑战性问题的重要手段。
[0003]中国专利申请(公开号为CN105607726A)公开一种降低高性能计算集群内存功耗的方法及装置,该专利中利用多个模块对高性能计算集群作业实时监控、分析,确定高性能计算集群目前运行的作业类型的内存容错机制,并根据内存容错机制的容错级别来对高性能计算集群的内存功耗进行分配,从而依据容错级别来调整内存功耗,降低内存功耗,在保持集群性能不变的前提下提高能耗比,但是其内部的计算过程耗时较久,并且在计算时需要多次反复的对计算数据进行搜索,在搜索的过程中难免会遗漏部分数据,或者对部分数据进行多次计算,从而增加装置的功耗,并且大数据的运算环境不同,因此在不同环境中计算的结果和速度都不同,上述专利技术中主要依据容错级别来调整内存功耗,可以选择其他方法,将需要计算的数据分配给不同计算环境,来提高装置与计算的匹配度,进而降低装置的本身功耗。
[0004]但是现有的降低高性能内存功耗的装置内部的计算过程耗时较久,并且在计算时需要多次反复的对计算数据进行搜索,在搜索的过程中难免会遗漏部分数据,或者对部分数据进行多次计算,并且在分配过程中数据的种类不同,需要计算的环境也不同,需要再次分配,现有的装置分配效果不够好,导致装置的功耗较高。

技术实现思路

[0005]本专利技术要解决的技术问题是:提供一种降低高性能计算内存功耗的装置及其使用方法,可以有效解决
技术介绍
现有的降低高性能内存功耗的装置内部的计算过程耗时较久,并且在计算时需要多次反复的对计算数据进行搜索,在搜索的过程中难免会遗漏部分数据,或者对部分数据进行多次计算,并且在分配过程中数据的种类不同,需要计算的环境也不同,需要再次分配,现有的装置分配效果不够好,导致装置的功耗较高的问题。
[0006]本专利技术采取的技术方案为:一种降低高性能计算内存功耗的装置,包括计算模块、监测模块、分析模块和分配模块;计算模块:包括多个众核协处理器和高性能内存单元,多个众核协处理器采用异构架构,高性能内存单元存储需要计算的数据,多个众核协处理器借助高性能内存单元对数据进行实时计算和处理,众核协处理器采用CPU+GPU的异构架构,实现并行处理功能,CPU
负责复杂的逻辑计算部分,GPU负责并行度高、分支少的密集运算,并将多个众核协处理器运用于大规模深度神经网络的训练,通过CHAOS的并行框架完成众核协处理器的线程并行操作;监测模块:包括资源管理单元、预警单元和数据传输单元,资源管理单元用于实时检测计算模块中高性能计算的运行情况,当高性能计算出现故障时,预警单元会亮灯预警并停止计算模块的工作,数据传输单元在计算模块正常工作时将计算得到的数据送至分析模块;分析模块:包括多个算法单元,多个算法单元分成多组执行不同的算法对监测模块传输的数据进行计算,其中部分算法单元使用宽度优先搜索算法,用位图的数据结构表示宽度优先搜索算法中的访问者结构,增大了访问者的局部性,减少了访存的次数,用从下到上的搜索方式,避免了多线程执行的原子操作,并通过结合从上到下与从下到上的搜索方法进一步减少搜索过程中遍历的次数,减小了访存开销,多个算法单元还具备内存绑定和线程绑定的优化技术,并对传入的数据进行划分,使得多线程并行执行时各线程在搜索时减少对远程的内存访问,进一步减小访存开销,分析完毕后将分析结果送至分配模块中;分配模块:包括主节点管理器、消息管理单元、从节点执行器和共享存储单元,主节点管理器提供任务编排定义和调度的功能,将接收的分析结果定义成需要运行的任务抛给消息管理单元;然后,运行在不同资源环境的从节点执行器从消息管理单元中监控自己需要执行的任务,当需要从节点执行器执行的任务出现,对应的从节点执行器就执行相应的任务;最后从节点执行器将需要输入和输出的文件都存储在一个共享存储单元中。
[0007]优选地,上述计算模块中CHAOS的并行框架采用HogWild方法将梯度累积存储在计算模块本体中,利用worker更新全局的权重参数,以此减少多个众核协处理器神经网络每一轮的训练时间。
[0008]优选地,上述资源管理单元使用统一的底层资源管理框架,在底层资源管理框架之上迁移和安装不同的应用框架。
[0009]优选地,上述CPU和GPU直接从高性能内存单元上读取数据,对高性能内存单元中的数据进行快速精确的计算。
[0010]优选地,上述底层资源管理框架中的不同应用框架都与底层资源管理框架相兼容。
[0011]优选地,上述GPU具有多线程技术和细粒度同步机制,借此对宽度优先搜索算法进行加速,并采用SIMDVLQ编码方法对外界的数据进行压缩。
[0012]优选地,上述众核协处理器与高性能内存单元相结合具有gather/scatter能力,在众核协处理器上采用自底向上和自顶向下的算法,使用数以千计数量的线程遍历图。
[0013]优选地,上述在分配模块的调度工作中,根据任务在不同阶段的特征,动态调度和配置I/O资源、计算资源、加速器资源、网络资源、数据与软件库资源。
[0014]一种降低高性能计算内存功耗装置的使用方法,其特征在于:所述具体步骤如下:步骤一:外界计算数据输入高性能内存单元存储,随后被多个众核协处理器一起计算,多个众核协处理器中的CPU和GPU直接从高性能内存单元上读取数据,通过CHAOS的并行框架完成众核协处理器的线程并行操作;步骤二:监测模块收到计算模块中传输的数据后利用资源管理单元进行实时监
测,并通过数据传输单元将正常的数据送至分析模块;步骤三:分析模块中的多个算法单元结合从上到下与从下到上的搜索方法对数据进行分析,其中部分算法单元用位图的数据结构表示宽度优先搜索算法中的访问者结构,多线程并行执行对数据分析的操作,分析完毕后将分析结果送至分配模块中;步骤四:分析结果送至分配模块中,分配模块将接收的分析结果定义成需要运行的任务抛给消息管理单元;运行在不同资源环境的从节点执行器从消息管理单元中监控自己需要执行的任务,当需要从节点执行器执行的任务出现,对应的从节点执行器就执行相应的任务;最后从节点执行器将需要输入和输出的文件都存储在一个共享存储单元中。
[0015]本专利技术的有益效果:与现有技术相比,本专利技术的效果如下:1)本专利技术中,通过计算模块的设置,多个众核协处理器采用异构架构,多个众核协处理器借助高性能内存单元对数据进行实时计算和处理,众核协处理器采用CPU+GPU的异构架构,实现并行处理功能,CPU负责复本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种降低高性能计算内存功耗的装置,其特征在于:包括计算模块、监测模块、分析模块和分配模块;计算模块:包括多个众核协处理器和高性能内存单元,多个众核协处理器采用异构架构,高性能内存单元存储需要计算的数据,多个众核协处理器借助高性能内存单元对数据进行实时计算和处理,众核协处理器采用CPU+GPU的异构架构,实现并行处理功能,CPU负责复杂的逻辑计算部分,GPU负责并行度高、分支少的密集运算,并将多个众核协处理器运用于大规模深度神经网络的训练,通过CHAOS的并行框架完成众核协处理器的线程并行操作;监测模块:包括资源管理单元、预警单元和数据传输单元,资源管理单元用于实时检测计算模块中高性能计算的运行情况,当高性能计算出现故障时,预警单元会亮灯预警并停止计算模块的工作,数据传输单元在计算模块正常工作时将计算得到的数据送至分析模块;分析模块:包括多个算法单元,多个算法单元分成多组执行不同的算法对监测模块传输的数据进行计算,其中部分算法单元使用宽度优先搜索算法,用位图的数据结构表示宽度优先搜索算法中的访问者结构,用从下到上的搜索方式,并通过结合从上到下与从下到上的搜索方法,多个算法单元还具备内存绑定和线程绑定的优化技术,并对传入的数据进行划分,分析完毕后将分析结果送至分配模块中;分配模块:包括主节点管理器、消息管理单元、从节点执行器和共享存储单元,主节点管理器提供任务编排定义和调度的功能,将接收的分析结果定义成需要运行的任务抛给消息管理单元;然后,运行在不同资源环境的从节点执行器从消息管理单元中监控自己需要执行的任务,当需要从节点执行器执行的任务出现,对应的从节点执行器就执行相应的任务;最后从节点执行器将需要输入和输出的文件都存储在一个共享存储单元中。2.根据权利要求1所述的一种降低高性能计算内存功耗的装置,其特征在于:所述计算模块中CHAOS的并行框架采用HogWild方法将梯度累积存储在计算模块本体中,利用worker更新全局的权重参数。3.根据权利要求2所述的一种降低高性能计算内存功耗的装置,其特征在于:所述资源管理单元使用统一的底层资源管理框架,在底层资源管理框架之上迁移和安装不同的应用框架。4.根...

【专利技术属性】
技术研发人员:甘润东龙玉江王策卫薇李洵卢仁猛钟掖王杰峰陈卿袁捷孙骏
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1