一种基于机器学习的CPU与GPU异构SoC性能刻画方法技术

技术编号:21343128 阅读:92 留言:0更新日期:2019-06-13 22:19
本发明专利技术涉及信息技术领域,具体而言,涉及一种基于机器学习的CPU与GPU异构SoC性能刻画方法,其包括以下步骤:S1:采集大性能数据;所述大性能数据包括CPU硬件事件数据与GPU硬件事件数据;S2:对采集的大性能数据进行处理;S3:对CPU与GPU进行性能刻画;S4:进行系统能耗采集与分析。本发明专利技术一方面用户可以根据在CPU和GPU端监控硬件事件得到能够反映人工智能程序性能特点,从而为优化人工智能程序提供指导;另一方面用户可以根据人工智能程序的性能特点,为适应人工智能程序而特定地优化编译器或计算机微体系结构提供指导,最后用户可以通过本框架中使用的监控策略和分析方法对CPU与GPU进行监控与分析。

A Performance Characterization Method of CPU and GPU Heterogeneous SoC Based on Machine Learning

The invention relates to the field of information technology, in particular to a machine learning-based performance characterization method for heterogeneous SoC between CPU and GPU, which includes the following steps: S1: acquisition of large performance data; the large performance data includes CPU hardware event data and GPU hardware event data; S2: processing of collected large performance data; S3: performance characterization of CPU and GPU; System energy consumption acquisition and analysis. On the one hand, according to the monitoring of hardware events on CPU and GPU, users can obtain the performance characteristics of AI programs, which can provide guidance for optimizing AI programs; on the other hand, according to the performance characteristics of AI programs, users can provide guidance for specific optimization of compilers or computer micro-architecture adapted to AI programs, and finally users can provide guidance for optimizing compilers or computer micro-architecture adapted to AI programs. CPU and GPU are monitored and analyzed by the monitoring strategy and analysis method used in this framework.

【技术实现步骤摘要】
一种基于机器学习的CPU与GPU异构SoC性能刻画方法
本专利技术涉及信息
,具体而言,涉及一种基于机器学习的CPU与GPU异构SoC性能刻画方法。
技术介绍
当前主流处理器是包含CPU核与GPU核的异构片上系统(SoC),并且人工智能研究与应用发展迅速。针对理解运行人工智能程序的这种异构SoC性能特征,提出CPU核与GPU核异构系统性能特征刻画模型。处理器的性能刻画能够辅助改进数据中心的服务器结构设计。另外,分析处理器的性能特征有助于优化编译器达到加速程序执行的效果。处理器的性能特征也为众多应用分析与优化提供重要的参考依据。当前主流的CPU性能特征分析通常使用AhmadYasin提出的Top-Down方法。该方法基于liunx内核中的perf工具构造一个自顶向下有层级的树结构。树节点的权值用于指导使用者重点关注真正有影响的那些因素,忽略不重要的部分。该方法的前提是使用者自选感兴趣的处理器微结构事件,而Intel处理器微结构事件数量多,从338到1423个不等。这种方法难以全面地分析CPU性能特征。当前针对人工智能程序benchmark作CPU与GPU的异构SoC处理器性能刻画本文档来自技高网...

【技术保护点】
1.一种基于机器学习的CPU与GPU异构SoC性能刻画方法,其特殊之处在于,包括以下步骤:S1:采集大性能数据;所述大性能数据包括CPU硬件事件数据与GPU硬件事件数据;S2:对采集的大性能数据进行处理;S3:对CPU与GPU进行性能刻画;S4:进行系统能耗采集与分析。

【技术特征摘要】
1.一种基于机器学习的CPU与GPU异构SoC性能刻画方法,其特殊之处在于,包括以下步骤:S1:采集大性能数据;所述大性能数据包括CPU硬件事件数据与GPU硬件事件数据;S2:对采集的大性能数据进行处理;S3:对CPU与GPU进行性能刻画;S4:进行系统能耗采集与分析。2.根据权利要求1所述的一种基于机器学习的CPU与GPU异构SoC性能刻画方法,其特殊之处在于:步骤S1包括:S101:按照OneCounterOneEvent的模式收集CPU硬件事件;S102:使用perf工具指定要采集的事件编码,采集间隔;S103:按照OneRunningOneEvent的模式收集GPU硬件事件;S104:使用nvprof工具指定要采集的事件编码。3.根据权利要求1所述的一种基于机器学习的CPU与GPU异构SoC性能刻画方法,其特殊之处在于:步骤S2包括:S201:CPU硬件事件处理部分,首先将运行时收集的事件原始格式转换成一次采样间隔多列的形式,接着再将不同运行时的...

【专利技术属性】
技术研发人员:喻之斌林灵锋伍浩文
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1