深度学习网络模型的图优化方法、编译器和相关设备技术

技术编号:37618084 阅读:15 留言:0更新日期:2023-05-18 12:09
本申请公开了一种深度学习网络模型的图优化。该方法包括确定并获取深度学习网络模型,其中深度学习网络模型定义有n个图优化策略,n为大于1的正整数,利用图优化编译器,对深度学习网络模型的n个图优化策略进行优化,以得到优化后的n个图优化策略,其中优化后的n个图优化策略按照预设顺序排列,预设顺序是由优化后的n个图优化策略的图优化算子按照预设规则确定的,进而利用所述优化后的n个图优化策略,按照预设顺序执行图优化操作。本申请还公开了编译器、芯片和电子设备。本申请通过利用图优化编译器,对深度学习网络模型的n个图优化策略进行优化,以得到优化后的n个图优化策略,以提高深度学习网络模型的图优化性能。以提高深度学习网络模型的图优化性能。以提高深度学习网络模型的图优化性能。

【技术实现步骤摘要】
深度学习网络模型的图优化方法、编译器和相关设备


[0001]本申请的所公开实施例涉及图像处理
,且更具体而言,涉及一种深度学习网络模型的图优化方法、编译器和相关设备。

技术介绍

[0002]目前,通过图优化处理可以消除掉深度学习网络模型中一些没用的或者不太常用的层,使用其得到简化,能够在引擎上运行,并且提升运行效率;或者对开源模型进行图优化处理,以减少模型计算量,进而可转化成其他芯片可以使用的模型。

技术实现思路

[0003]根据本申请的实施例,本申请提出一种深度学习网络模型的图优化方法、编译器和相关设备,以提高深度学习网络模型的图优化性能。
[0004]本申请的第一方面公开了深度学习网络模型的图优化方法,包括:确定并获取深度学习网络模型,其中所述深度学习网络模型定义有n个图优化策略,n为大于1的正整数;利用图优化编译器,对所述深度学习网络模型的n个图优化策略进行优化,以得到优化后的n个图优化策略,其中所述优化后的n个图优化策略按照预设顺序排列,所述预设顺序是由所述优化后的n个图优化策略的图优化算子按照预设规则确定的;利用所述优化后的n个图优化策略,按照所述预设顺序执行图优化操作。
[0005]在一些实施例中,所述预设规则是采用相应的图优化算子的调用顺序进行图优化操作时所得到的图优化效果确定的。
[0006]在一些实施例中,所述n个图优化策略包括常量折叠策略、层融合策略、层消除策略和层替换策略中的至少一个;所述预设规则包括所述层融合策略和所述层替换策略的图优化算子的等级高于所述常量折叠策略和所述层融合策略的图优化算子。
[0007]在一些实施例中,所述n个图优化策略包括第一图优化策略和第二图优化策略,其中所述第一图优化策略的图优化算子的等级低于所述第二图优化策略的图优化算子的等级,则在所述优化后的n个图优化策略中,所述第一图优化策略位于所述第二图优化策略之后。
[0008]在一些实施例中,所述利用所述优化后的n个图优化策略,按照所述预设顺序执行图优化操作,包括:利用所述第二图优化策略执行图优化操作;利用所述第一图优化策略执行图优化操作。
[0009]本申请第二方面公开了一种编译器,用于优化深度学习网络模型,其中所述深度学习网络模型定义有n个图优化策略,n为大于1的正整数,所述编译器用于:对所述深度学习网络模型的n个图优化策略进行优化,以得到优化后的n个图优化策略,其中所述优化后的n个图优化策略按照预设顺序排列,所述预设顺序是由所述优化后的n个图优化策略的图优化算子按照预设规则确定的;利用所述优化后的n个图优化策略,按照所述预设顺序执行图优化操作。
[0010]本申请第三方面公开了一种芯片,包括如第二方面中所述的编译器。
[0011]本申请第四方面公开了一种电子设备,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现第一方面中所述的深度学习网络模型的图优化方法,或者所述处理器用于实现第二方面中所述的编译器。
[0012]本申请的有益效果有:确定并获取深度学习网络模型,其中深度学习网络模型定义有n个图优化策略,n为大于1的正整数,利用图优化编译器,对深度学习网络模型的n个图优化策略进行优化,以得到优化后的n个图优化策略,其中优化后的n个图优化策略按照预设顺序排列,预设顺序是由优化后的n个图优化策略的图优化算子按照预设规则确定的,进而利用所述优化后的n个图优化策略,按照预设顺序执行图优化操作,以提高深度学习网络模型的图优化性能。
附图说明
[0013]下面将结合附图及实施方式对本申请作进一步说明,附图中:
[0014]图1是本申请实施例的深度学习网络模型的图优化方法的流程示意图;
[0015]图2是本申请一实施例的图优化的效果示意图;
[0016]图3是本申请一实施例的调用顺序的效果示意图;
[0017]图4是本申请实施例的编译器的结构示意图;
[0018]图5是本申请实施例的芯片的结构示意图;
[0019]图6是本申请实施例的电子设备的结构示意图。
具体实施方式
[0020]在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0021]本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。另外,本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
[0022]为使本领域的技术人员更好地理解本申请的技术方案,下面结合附图和具体实施方式对本申请的技术方案做进一步详细描述。
[0023]请参阅图1,图1是本申请实施例的深度学习网络模型的图优化方法的流程示意图。该方法的执行主体可以是有计算功能的电子设备,例如,微型计算机、服务器,以及笔记本电脑、平板电脑等移动设备等。
[0024]需注意的是,若有实质上相同的结果,本申请的方法并不以图1所示的流程顺序为限。
[0025]在一些可能的实现方式中,该方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现,如图1所示,该方法可以包括如下步骤:
[0026]S11:确定并获取深度学习网络模型,其中深度学习网络模型定义有n个图优化策略,n为大于1的正整数。
[0027]深度学习网络模型属于一种神经网络模型,深度学习网络模型和神经网络模型都必须经由训练产生,即将样本数据输入到设计好的网络结构(即网络结构已经确定)中,经由多个中间层提取特征信息,并基于输出层的输出结果不断地修正神经元的权重参数,使输出层的输出结果愈来愈趋向于预设结果,直至确定最终的权重参数。训练好的深度学习网络模型可以真正地应用于实际场景中,同时还可以收集深度学习网络模型在实际场景中的使用情况,反过来优化深度学习网络模型。
[0028]确定并获取的深度学习网络模型定义有n个图优化策略,n为大于1的正整数,例如深度学习网络模型可以定义有2个图优化策略,其中深度学习网络模型是由算子连接构成的有向无环图,算子是指在深度学习网络模型中构建的用于实现特定功能的一系列操作的集合。图优化策略是指可以对这个图的子图替换为一个计算等价的另一个子图,从而对这个子图实施更加高效的计算,以提高该数据流图在硬件上的运行性能。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度学习网络模型的图优化方法,其特征在于,包括:确定并获取深度学习网络模型,其中所述深度学习网络模型定义有n个图优化策略,n为大于1的正整数;利用图优化编译器,对所述深度学习网络模型的n个图优化策略进行优化,以得到优化后的n个图优化策略,其中所述优化后的n个图优化策略按照预设顺序排列,所述预设顺序是由所述优化后的n个图优化策略的图优化算子按照预设规则确定的;利用所述优化后的n个图优化策略,按照所述预设顺序对所述深度学习网络模型的图表示执行图优化操作。2.根据权利要求1所述方法,其特征在于,所述预设规则是采用相应的图优化算子的调用顺序进行图优化操作时所得到的图优化效果确定的。3.根据权利要求2所述方法,其特征在于,所述n个图优化策略包括常量折叠策略、层融合策略、层消除策略和层替换策略中的至少一个;所述预设规则包括所述层融合策略和所述层替换策略的图优化算子的等级高于所述常量折叠策略和所述层融合策略的图优化算子。4.根据权利要求2所述方法,其特征在于,所述n个图优化策略包括第一图优化策略和第二图优化策略,其中所述第一图优化策略的图优化算子的等级低于所述第二图优化策略的图优化算子的等级,则在所述优化后的n个图优化策略中,所述第一图优化策略位于所述第二图优化策略之后。5.根据权利要求4所述方法,其特征在于,所述利用所述优化后的n个图优化策略,按照所述预设顺序执行图优化操作...

【专利技术属性】
技术研发人员:朱磊光韩建强陈波扬王超毛佳丽
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1