预估执行神经网络模型所需时间的方法及相关产品技术

技术编号：33131710 阅读：29 留言：0更新日期：2022-04-17 00:49

本披露提供一种预估执行神经网络模型所需时间的方法及相关产品，其中，所述方法包括：获得所述神经网络模型、所述人工智能处理器的硬件参数；根据所述神经网络模型和所述人工智能处理器的硬件参数对所述神经网络模型进行处理，获得对应的二进制指令；根据所述神经网络模型对应的硬件二进制指令获得执行所述神经网络模型所需时间。经网络模型所需时间。经网络模型所需时间。

全部详细技术资料下载

【技术实现步骤摘要】
预估执行神经网络模型所需时间的方法及相关产品

[0001]本披露涉及神经网络领域，尤其涉及一种预估人工智能处理器执行神经网络模型所需时间的方法及相关产品。

技术介绍

[0002]近年来，深度学习加速器被不断提出，并如同通用处理器一样，正在由单核向多核扩展。这种扩展后的多核结构可以在训练阶段支持数据并行的方式来提高数据吞吐量，加快训练速度。然而，在推理阶段，相比吞吐量深度神经网络对端到端的时延有着更高的要求，这往往决定了加速器在某个场景下的可用性。传统的数据并行方案不能满足推理场景下对加速器小数据、低延迟的要求。
[0003]在多核处理系统中，根据系统的可用核数可以将网络的输入数据拆分成不同的规模，在不同的核上进行计算；不同的数据拆分策略可能有不同的性能表现。因此，为了解决在多核处理器上进行多核拆分运算过程中的拆分策略选择问题，拆分策略的选择需要预估执行该神经网络模型所需的时间。因此，急需解决该时间预估问题。

技术实现思路

[0004]为了解决该技术问题，本披露实施例提供了一种预估人工智能处理器执行神经网络模型所需时间的方法及相关产品。
[0005]第一方面，提供一种预估人工智能处理器执行神经网络模型所需时间的方法，所述预估方法包括如下步骤：
[0006]获得所述神经网络模型、所述人工智能处理器的硬件参数；
[0007]根据所述神经网络模型和所述人工智能处理器的硬件参数对所述神经网络模型进行处理，获得对应的二进制指令；
[0008]根据所述神经网络模型对应的硬件二

【技术保护点】

【技术特征摘要】
1.一种预估人工智能处理器执行神经网络模型所需时间的方法，其特征在于，所述预估方法包括如下步骤：获得所述神经网络模型、所述人工智能处理器的硬件参数；根据所述神经网络模型和所述人工智能处理器的硬件参数对所述神经网络模型进行处理，获得对应的二进制指令；根据所述神经网络模型对应的硬件二进制指令获得执行所述神经网络模型所需时间。2.根据权利要求1所述的方法，其特征在于，根据所述神经网络模型的网络信息和所述人工智能处理器的硬件参数对所述神经网络模型进行处理的步骤包括：根据所述神经网络模型获得对应的计算图；在计算图中按照拓扑排序的顺序，遍历计算图的节点，依次进行算子的执行树的生成；根据所述人工智能处理器的硬件参数，对所述执行树进行编译优化；解析编译优化后的执行树，获得编译优化后的算子的指令块；对所述指令块进行重排，获得对应的硬件二进制指令。3.根据权利要求1所述方法，其特征在于，所述根据所述神经网络模型对应的硬件二进制指令获得执行所述神经网络模型所需时间的步骤包括：将所述硬件二进制指令进行分类，获得I/O指令集合和计算指令集合；将所述I/O指令集合中的I/O指令发送至I/O指令队列中，将计算指令集合中的计算指令发送至计算指令队列中，在指令队列存在指令堵塞时，获得等待时间；获取每个I/O指令的执行时间以及每个计算指令的执行时间，所有I/O指令的执行时间之和为I/O执行时间，所有计算指令执行时间之和为计算执行时间，从所述I/O执行时间和所述计算执行时间中取最大值，获得执行时间；根据所述等待时间和所述执行时间获得执行所述神经网络模型所需时间。4.根据权利要求1所述的方...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人