【技术实现步骤摘要】
本专利技术涉及计算机,具体涉及一种程序优化方法、装置、终端和计算机可读存储介质。
技术介绍
1、深度学习算法由一个个计算单元组成,这些计算单元即为算子(operator,op)。在网络模型中,算子对应层中的计算逻辑,例如:卷积层(convolution layer)是一个算子;全连接层(fully-connected layer,fc layer)中的权值求和过程,是一个算子。算子程序则是反映某种计算逻辑的、在硬件环境中运行的程序。
2、通常在深度学习中,通过算子的编译优化来完成程序的编译优化。现有的编译优化方式有两种:一种采用手写算子的方式,将常见的算子编译成算子库,运行时调用;这种方法的缺点是适应性差,遇到新算子需要算子开发人员手工编写算子,并且不能采用算子融合的方式进行优化,并且人工编写耗时较长,从而导致算子程序开发效率低下。第二种是编译器方式,自动优化代码生成算子程序。但第二种方式的优化性能不如由领域专家手动编译算子程序,从而无法得到运行性能最优的算子程序。
技术实现思路
< ...【技术保护点】
1.一种程序优化方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述N次处理参数中任意一次处理参数包括下列参数中的至少一种参数:
3.如权利要求1所述的方法,其特征在于,所述根据所述第一程序以及所述M种参数组合,确定所述M种参数组合中每组参数组合的时钟周期,包括:
4.如权利要求3所述的方法,其特征在于,所述根据计算代价模型和所述M种模板程序,得到与所述M种模板程序一一对应的M个计算时钟周期,包括:
5.如权利要求3所述的方法,其特征在于,所述根据数据搬运代价模型和所述M种模板程序,得到与所述M种模板程
...【技术特征摘要】
1.一种程序优化方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述n次处理参数中任意一次处理参数包括下列参数中的至少一种参数:
3.如权利要求1所述的方法,其特征在于,所述根据所述第一程序以及所述m种参数组合,确定所述m种参数组合中每组参数组合的时钟周期,包括:
4.如权利要求3所述的方法,其特征在于,所述根据计算代价模型和所述m种模板程序,得到与所述m种模板程序一一对应的m个计算时钟周期,包括:
5.如权利要求3所述的方法,其特征在于,所述根据数据搬运代价模型和所述m种模板程序,得到与所述m种模板程序一一对应的m个数据搬运时钟周期,包括:
【专利技术属性】
技术研发人员:卿思奇,包新启,蔡万伟,
申请(专利权)人:深圳云天励飞技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。