一种跨平台张量程序性能预测方法技术

技术编号:42367703 阅读:22 留言:0更新日期:2024-08-16 14:49
本发明专利技术公开了一种跨平台张量程序性能预测方法,涉及深度学习编译优化技术领域,包括:定义张量程序的总体执行代价;在源平台上未执行张量程序时,直接从张量程序的LLVM IR中提取与硬件无关的静态程序特征;在源平台上执行张量程序时,提取与硬件无关的动态程序特征;基于张量程序的重用配置文件和目标平台的缓存参数,计算得到访存指令代价,通过在目标平台执行目标硬件的微基准测试获取计算指令代价;将每个基本块的任务图、访存指令代价和计算指令代价输入到性能预测器中,得到在目标平台上张量程序的预测执行代价;该张量程序性能预测方法,规避了在目标平台上进行性能测量的巨大开销。

【技术实现步骤摘要】

本专利技术涉及深度学习编译优化,尤其涉及一种跨平台张量程序性能预测方法


技术介绍

1、深度学习已经在众多领域取得了前所未有的成功,但它巨大的计算量也给模型的落地带来了巨大的挑战。如何充分利用现有的计算资源,最大化提升模型的推理速度,提高模型在实际生产环境中的实时性,是当前深度学习发展的热点问题之一。

2、经验搜索(empirical search)方法被广泛应用于优化深度学习推理,典型的代表工作有基于模板的autotvm和不依赖模板的ansor等。这些方法通过一定策略产生很多等价的张量程序,然后对它们进行性能评估,最终挑选出性能最优的张量程序。

3、近年来,使用基于学习的方式预测张量程序性能越来越流行,这种方式虽然可以简化性能预测模型的开发,并实现较高的预测精度,但依赖目标硬件的大规模性能数据(数百万)。由于不同平台上的程序和硬件是绑定的,跨平台之间的性能测试不能交互使用,增加了张量程序性能预测的成本。

4、一些现有技术使用迁移学习的方法缓解这一问题,例如tenset、tlp、moss等,然而它们依旧需要相当多的性能数本文档来自技高网...

【技术保护点】

1.一种跨平台张量程序性能预测方法,其特征在于,基于在目标平台上复用张量程序中与硬件无关的程序特征,实现张量程序的快速性能预测,张量程序性能预测方法包括如下步骤:

2.根据权利要求1所述的跨平台张量程序性能预测方法,其特征在于,在步骤一中,基本块BBij的执行代价Cost(BBij)定义如下:

3.根据权利要求1所述的跨平台张量程序性能预测方法,其特征在于,在步骤一中,基本块BBij的有效执行次数ECount(BBij)定义如下:

4.根据权利要求1所述的跨平台张量程序性能预测方法,其特征在于,在步骤二中,静态程序特征的生成过程如下

5....

【技术特征摘要】

1.一种跨平台张量程序性能预测方法,其特征在于,基于在目标平台上复用张量程序中与硬件无关的程序特征,实现张量程序的快速性能预测,张量程序性能预测方法包括如下步骤:

2.根据权利要求1所述的跨平台张量程序性能预测方法,其特征在于,在步骤一中,基本块bbij的执行代价cost(bbij)定义如下:

3.根据权利要求1所述的跨平台张量程序性能预测方法,其特征在于,在步骤一中,基本块bbij的有效执行次数ecount(bbij)定义如下:

4.根据权利要求1所述的跨平台张量程序性能预测方法,其特征在于,在步骤二中,静态程序特征的生成过程如下:

5.根据权利要求4所述的跨平台张量程序性能预测方法,其特征在于,在对张量程序p的llvm ir进行控制...

【专利技术属性】
技术研发人员:张昱孙新雨
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1