硬件算子匹配方法及相关产品组成比例

技术编号:22056903 阅读:37 留言:0更新日期:2019-09-07 15:50
本申请实施例公开了一种硬件算子匹配方法及相关产品,应用于电子设备,电子设备包括神经网络处理器NPU、控制器和模拟器,通过在所述NPU运行神经网络模型至第i层时,控制器确定第i层对应的多个参考硬件算子,模拟器模拟运行多个参考硬件算子,得到多个参考硬件算子对应的多个运行周期循环数,控制器确定多个运行周期循环数中最小值对应的目标硬件算子,控制器根据目标硬件算子执行第i层的运算,如此,可通过自动匹配得到满足神经网络模型中的运算功能、并且性能最优的硬件算子,减少人工开发量,减少开发时间,降低维护成本。

Hardware Operator Matching Method and Related Products

【技术实现步骤摘要】
硬件算子匹配方法及相关产品
本申请涉及人工智能
,具体涉及一种硬件算子匹配方法及相关产品。
技术介绍
在运行神经网络模型中的过程中,神经网络处理器(neuralnetworkprocessingunit,NPU)具有一套完整的指令集。通过指令集可以实现神经网络模型中的算子。当系统中存在一个以上的硬件算子可以支持同一种运算操作,需要选择一个最优的硬件算子,在现有技术中,选择硬件算子通常由人工测试并添加固定的规则来选择硬件算子。但是,由于需要人工参与制定选择规则,当硬件算子的参数个数增多后,导致规则也随之变得更多更复杂,导致维护成本高。当需要添加更高性能的硬件算子时,也需要增加或修改现有规则,导致开发周期较长。因此,如何在运行神经网路模型的过程中提高选择硬件算子的效率的问题亟待解决。
技术实现思路
本申请实施例提供了一种硬件算子匹配方法及相关产品,可通过自动匹配得到满足神经网络模型中的运算功能、并且性能最优的硬件算子。第一方面,本申请实施例提供了一种硬件算子匹配方法,应用于电子设备,所述电子设备包括神经网络处理器NPU、控制器和模拟器,所述方法包括:在所述NPU运行神经网络模型至第i层本文档来自技高网...

【技术保护点】
1.一种硬件算子匹配方法,其特征在于,应用于电子设备,所述电子设备包括神经网络处理器NPU、控制器和模拟器,所述方法包括:在所述NPU运行神经网络模型至第i层时,所述控制器确定所述第i层对应的多个参考硬件算子,所述第i层为所述神经网络模型中的任意一层;所述模拟器模拟运行所述多个参考硬件算子,得到所述多个参考硬件算子对应的多个运行周期循环数,每一参考硬件算子对应一个运行周期循环数;所述控制器确定所述多个运行周期循环数中最小值对应的目标硬件算子;以及,根据所述目标硬件算子执行所述第i层的运算。

【技术特征摘要】
1.一种硬件算子匹配方法,其特征在于,应用于电子设备,所述电子设备包括神经网络处理器NPU、控制器和模拟器,所述方法包括:在所述NPU运行神经网络模型至第i层时,所述控制器确定所述第i层对应的多个参考硬件算子,所述第i层为所述神经网络模型中的任意一层;所述模拟器模拟运行所述多个参考硬件算子,得到所述多个参考硬件算子对应的多个运行周期循环数,每一参考硬件算子对应一个运行周期循环数;所述控制器确定所述多个运行周期循环数中最小值对应的目标硬件算子;以及,根据所述目标硬件算子执行所述第i层的运算。2.根据权利要求1所述的方法,其特征在于,所述控制器确定所述第i层对应的多个参考硬件算子,包括:所述控制器解析所述第i层,得到所述第i层的目标网络参数;从预设的数据表中查询与所述目标网络参数对应的多个参考硬件算子。3.根据权利要求2所述的方法,其特征在于,所述第i层包括卷积算子,所述目标网络参数包括以下至少一种:所述卷积算子的卷积核大小、卷积步长、输入尺寸、卷积核类型或内边距,所述从预设的数据表中查询与所述目标网络参数对应的多个参考硬件算子,包括:根据所述卷积算子的卷积核大小、卷积步长、输入尺寸、卷积核类型或内边距查询所述数据表,得到与所述卷积核大小、卷积步长、输入尺寸、卷积核类型或内边距均一致的多个参考卷积硬件算子。4.根据权利要求1-3任一项所述的方法,所述模拟器模拟运行所述多个参考硬件算子,得到所述多个参考硬件算子对应的多个运行周期循环数,包括:所述模拟器构造一组输入数据;翻译所述多个参考硬件算子中每一参考硬件算子的指令流,得到多个指令流,所述多个指令流中每一指令流包含多个指令;根据所述输入数据分别模拟执行所述多个指令流中每一指令流,得到所述多个指令流对应的多个运行周期循环数。5.根据权利要求4所述的方法,其特征在于,所述根据所述输入数据分别模拟执行所述多个指令流中每一指令流,得到所述多个指令流对应的多个运行周期循环数,包括:获取指令流j中的多个指令,所述指令流j为所述多个指令流中的任一指令流;根据所述输入数据执行所述指令流j中的多个指令,并记录所述多个指令中每一指令对应的指令周期循环...

【专利技术属性】
技术研发人员:周明君方攀陈岩
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1