System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于优化深度神经网络能效的自适应DVFS方法和装置制造方法及图纸_技高网

一种用于优化深度神经网络能效的自适应DVFS方法和装置制造方法及图纸

技术编号:41010905 阅读:21 留言:0更新日期:2024-04-18 21:47
本发明专利技术公开了一种用于优化深度神经网络能效的自适应DVFS方法和装置。该方法包括:通过全局特征提取器提取深度神经网络DNNs的全局特征并输入到聚类超参数预测模型中,通过聚类超参数预测模型预测当前DNNs的聚类超参数;根据预测得到的聚类超参数和深度特征提取器提取的DNNs细粒度深度特征进行功耗行为相似性聚类,以将DNNs划分为多个功耗块并形成功耗视图,再将每个功耗块的全局特征输入到决策模型以得到每个功耗块的目标决策频率;在DNNs的每个功耗块之前设置DVFS插桩点,根据目标决策频率预先在DNNs内的每个功耗块设置目标频率。本发明专利技术通过对DNNs任务进行预分析,根据决策信息预先在DNN内的每个功耗块设置目标频率,能够确保神经网络在保持性能的同时实现能效优化。

【技术实现步骤摘要】

本专利技术实施例涉及深度神经网络优化的,尤其涉及一种用于优化深度神经网络能效的自适应dvfs方法和装置。


技术介绍

1、深度神经网络(dnns)的快速发展和广泛应用为众多领域如图像处理、自然语言处理等带来了显著的技术进步。随着dnns的模型结构越来越复杂,它们的计算需求和数据处理量也呈指数级增长。这一趋势使得能源效率成为部署应用dnns时的一个关键考量因素。大规模运行这些复杂模型会导致巨大的能源消耗,从而引发经济成本和安全问题。

2、动态电压和频率缩放(dvfs)技术受到了越来越多的关注。dvfs通过调整处理器的电压和频率,可以在不改变模型结构的前提下,显著降低功耗。这种技术要应用到dnns仍然面临挑战,因为dnns在运行时会经历不同的算子,每类算子的能效要求和性能目标都可能有所不同。合适地制定dvfs的应用策略,可以在dnns的运行过程中动态调整dvfs配置,即通过调整处理器的频率来平衡dnns内部各部分的能耗和性能,以优化整体的能效。但在应对dnns的计算需求时,传统的dvfs策略面临着响应滞后、频率摇摆不定(即“频率乒乓”现象)等挑战。这些策略通常依赖于历史数据(如处理器利用率和任务计算负载)和启发式规则,往往难以实时准确地适应dnns运行时的动态变化,使计算需求与频率调整之间不匹配,进而导致能效优化效果不佳。此外,不同硬件平台间性能特征和利用率指标的差异,使得传统dvfs策略在迁移和优化时面临重大挑战。


技术实现思路

1、本专利技术提供一种用于优化深度神经网络能效的自适应dvfs方法和装置,以提升dnns的能效并保证其在多样化计算环境中的高效运行。

2、第一方面,本专利技术实施例提供一种用于优化深度神经网络能效的自适应dvfs方法,包括:

3、s1、通过全局特征提取器提取深度神经网络dnns的全局特征并输入到聚类超参数预测模型中,以通过所述聚类超参数预测模型预测当前dnns的聚类超参数;

4、s2、根据预测得到的聚类超参数和深度特征提取器提取的dnns细粒度深度特征进行功耗行为相似性聚类,以将dnns划分为多个功耗块并形成功耗视图,再将每个功耗块的全局特征输入到决策模型以得到每个功耗块的目标决策频率;

5、s3、在dnns的每个功耗块之前设置dvfs插桩点,根据所述目标决策频率预先在dnns内的每个功耗块设置目标频率。

6、可选的,所述s2具体包括:

7、采用引入距离正则化项的马氏距离映射和量化算子之间的功耗距离;

8、基于所述功耗距离,采用聚类算法的邻域半径和簇中最小点数超参数将dnns划分为多个功耗块,以形成dnns的功耗视图;

9、通过全局特征提取器提取每个功耗块的全局特征作为决策模型的输入,以通过所述决策模型输出每个功耗块的目标决策频率。

10、可选的,所述深度特征提取器用于提取dnns的通用特征和特定特征。

11、可选的,所述全局特征提取器用于提取dnns的宏观结构特征以及进行特征的统计和聚合。

12、可选的,在聚类超参数预测模型的训练过程中,将全局特征中的结构特征作为模型训练初始阶段的输入,将全局特征中的统计特征作为模型训练中期阶段的输入。

13、第二方面,本专利技术还提供一种用于优化深度神经网络能效的自适应dvfs装置,包括:

14、聚类超参数预测模块,用于通过全局特征提取器提取深度神经网络dnns的全局特征并输入到聚类超参数预测模型中,以通过所述聚类超参数预测模型预测当前dnns的聚类超参数;

15、目标频率决策模块,用于根据预测得到的聚类超参数和深度特征提取器提取的dnns细粒度深度特征进行功耗行为相似性聚类,以将dnns划分为多个功耗块并形成功耗视图,再将每个功耗块的全局特征输入到决策模型以得到每个功耗块的目标决策频率;

16、目标频率预设模块,用于在dnns的每个功耗块之前设置dvfs插桩点,根据所述目标决策频率预先在dnns内的每个功耗块设置目标频率。

17、可选的,所述目标频率决策模块具体用于:

18、采用引入距离正则化项的马氏距离映射和量化算子之间的功耗距离;

19、基于所述功耗距离,采用聚类算法的邻域半径和簇中最小点数超参数将dnns划分为多个功耗块,以形成dnns的功耗视图;

20、通过全局特征提取器提取每个功耗块的全局特征作为决策模型的输入,以通过所述决策模型输出每个功耗块的目标决策频率。

21、本专利技术的有益效果:

22、(1)本专利技术提出了一种功耗敏感的特征提取方法,并根据功耗行为相似度进行聚类。这种方法能准确识别dnns的关键功耗块,将功耗块作为dvfs的基本单元,从而防止频率乒乓现象。此外,这种方法通过在每个区块前预设dvfs插桩点并在插桩点完成频率调整,能够有效缓解调频滞后问题,从而实现更精确的频率调整。

23、(2)本专利技术采用了一个决策模型来预测和自适应预设每个区块的目标频率,解决了频率调整的准确性问题,可确保频率设置符合每个功耗块的不同性能和功耗要求。

24、(3)本专利技术的技术方案无需人工干预,可以确保其在不同硬件平台上的稳定高效的运行。

本文档来自技高网...

【技术保护点】

1.一种用于优化深度神经网络能效的自适应DVFS方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述S2具体包括:

3.根据权利要求1所述的方法,其特征在于,所述深度特征提取器用于提取DNNs的通用特征和特定特征。

4.根据权利要求1所述的方法,其特征在于,所述全局特征提取器用于提取DNNs的宏观结构特征以及进行特征的统计和聚合。

5.根据权利要求1所述的方法,其特征在于,在聚类超参数预测模型的训练过程中,将全局特征中的结构特征作为模型训练初始阶段的输入,将全局特征中的统计特征作为模型训练中期阶段的输入。

6.一种用于优化深度神经网络能效的自适应DVFS装置,其特征在于,包括:

7.根据权利要求6所述的装置,其特征在于,所述目标频率决策模块具体用于:

【技术特征摘要】

1.一种用于优化深度神经网络能效的自适应dvfs方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述s2具体包括:

3.根据权利要求1所述的方法,其特征在于,所述深度特征提取器用于提取dnns的通用特征和特定特征。

4.根据权利要求1所述的方法,其特征在于,所述全局特征提取器用于提取dnns的宏观结构特征以及进行特征的...

【专利技术属性】
技术研发人员:耿家伟朱宗卫陈香兰周学海
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1