程序优化方法、装置、终端和计算机可读存储介质制造方法及图纸

技术编号:40739139 阅读:26 留言:0更新日期:2024-03-25 19:59
本发明专利技术实施例公开了一种程序优化方法、装置、终端和计算机可读存储介质;本发明专利技术实施例包括:获取第一程序的N次预处理对应的N次处理参数;对所述N次处理参数中不同次处理参数包括的参数进行组合,得到M种参数组合;根据所述第一程序以及所述M种参数组合确定所述M种参数组合中每组参数组合的时钟周期;在所述M种参数组合中确定时钟周期最短的第一参数组合;根据第一参数组合对所述第一程序进行优化处理,得到第二程序,得到第二程序。本发明专利技术实施例可以显著提高算子程序的执行速度,降低了算子程序优化的人工干预程度,提高算子程序开发效率。

【技术实现步骤摘要】

本专利技术涉及计算机,具体涉及一种程序优化方法、装置、终端和计算机可读存储介质


技术介绍

1、深度学习算法由一个个计算单元组成,这些计算单元即为算子(operator,op)。在网络模型中,算子对应层中的计算逻辑,例如:卷积层(convolution layer)是一个算子;全连接层(fully-connected layer,fc layer)中的权值求和过程,是一个算子。算子程序则是反映某种计算逻辑的、在硬件环境中运行的程序。

2、通常在深度学习中,通过算子的编译优化来完成程序的编译优化。现有的编译优化方式有两种:一种采用手写算子的方式,将常见的算子编译成算子库,运行时调用;这种方法的缺点是适应性差,遇到新算子需要算子开发人员手工编写算子,并且不能采用算子融合的方式进行优化,并且人工编写耗时较长,从而导致算子程序开发效率低下。第二种是编译器方式,自动优化代码生成算子程序。但第二种方式的优化性能不如由领域专家手动编译算子程序,从而无法得到运行性能最优的算子程序。


技术实现思路

<p>1、本专利技术实本文档来自技高网...

【技术保护点】

1.一种程序优化方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述N次处理参数中任意一次处理参数包括下列参数中的至少一种参数:

3.如权利要求1所述的方法,其特征在于,所述根据所述第一程序以及所述M种参数组合,确定所述M种参数组合中每组参数组合的时钟周期,包括:

4.如权利要求3所述的方法,其特征在于,所述根据计算代价模型和所述M种模板程序,得到与所述M种模板程序一一对应的M个计算时钟周期,包括:

5.如权利要求3所述的方法,其特征在于,所述根据数据搬运代价模型和所述M种模板程序,得到与所述M种模板程序一一对应的M个数据...

【技术特征摘要】

1.一种程序优化方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述n次处理参数中任意一次处理参数包括下列参数中的至少一种参数:

3.如权利要求1所述的方法,其特征在于,所述根据所述第一程序以及所述m种参数组合,确定所述m种参数组合中每组参数组合的时钟周期,包括:

4.如权利要求3所述的方法,其特征在于,所述根据计算代价模型和所述m种模板程序,得到与所述m种模板程序一一对应的m个计算时钟周期,包括:

5.如权利要求3所述的方法,其特征在于,所述根据数据搬运代价模型和所述m种模板程序,得到与所述m种模板程序一一对应的m个数据搬运时钟周期,包括:

【专利技术属性】
技术研发人员:卿思奇包新启蔡万伟
申请(专利权)人:深圳云天励飞技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1