基于神经网络模型的推理和编译方法及其相关产品技术

技术编号：30323534 阅读：16 留言：0更新日期：2021-10-09 23:52

本公开涉及一种基于神经网络模型的推理方法、编译方法、计算装置、板卡和计算机程序产品，该计算装置包括在组合处理装置中，该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互，共同完成用户指定的计算操作。组合处理装置还可以包括存储装置，该存储装置分别与计算装置和其他处理装置连接，用于存储该计算装置和其他处理装置的数据。本披露的方案可以高效地选取目标数据中前预定数目个最大值。据中前预定数目个最大值。据中前预定数目个最大值。

全部详细技术资料下载

【技术实现步骤摘要】
基于神经网络模型的推理和编译方法及其相关产品

[0001]本公开一般地涉及人工智能领域。更具体地，本公开涉及一种基于神经网络模型的推理方法、用于优化神经网络模型的编译方法、执行前述推理和编译方法的计算装置，包括该计算装置的板卡和计算机程序产品。

技术介绍

[0002]当前的神经网络模型通常会在其模型的末尾使用全连接层和topk层来输出该神经网络模型的网络得分。在该应用场景中，全连接层的权值数据量较大，通常达到吉比特或数百兆级别。由于这样级别的数据量，当在向执行全连接层运算的硬件进行数据加载时，将给IO端口带来显著的数据交互量并且造成运算的低效。

技术实现思路

[0003]鉴于上述
技术介绍
部分所提及的技术问题，本披露提出一种用于优化topk运算的方案，从而高效地选取目标数据中前预定数目个最大值。为此，本公开在如下的多个方面中提供用于基于神经网络模型的推理方案和优化方案。
[0004]在第一方面中，本公开提供了一种基于神经网络模型的推理方法，其中所述神经网络模型包括相互连接的全连接层和topk层，所述推理方法由人工智能处理器来执行，并且包括：接收经所述神经网络模型的全连接层运算所输出的待处理张量数据，其中所述待处理张量数据包括多个数据元素；以及对所述待处理张量数据执行基于最大池化操作的topk层运算，以从所述多个数据元素中获取前预定数目个最大值。
[0005]在第二方面中，本公开提供了一种用于优化神经网络模型的编译方法，其中所述神经网络模型包括相互连接的全连接层和topk层，所述编译方法由...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络模型的推理方法，其中所述神经网络模型包括相互连接的全连接层和topk层，所述推理方法由人工智能处理器来执行，并且包括：接收经所述神经网络模型的全连接层运算所输出的待处理张量数据，其中所述待处理张量数据包括多个数据元素；以及对所述待处理张量数据执行基于最大池化操作的topk层运算，以从所述多个数据元素中获取前预定数目个最大值。2.根据权利要求1所述的推理方法，其中在执行所述全连接层运算和所述topk层运算操作期间，所述推理方法还包括：向所述全连接层加载输入数据，以用于所述全连接层和topk层的下一次运算。3.根据权利要求2所述的推理方法，其中向所述全连接层加载输入数据包括：将所述输入数据进行拆分，以得到多个输入子数据；以及以乒乓方式将所述多个输入子数据逐次加载到所述全连接层的输入，以用于所述全连接层运算。4.根据权利要求3所述的推理方法，其中所述输入数据包括权值数据，并且其中向所述全连接层加载输入数据包括：将所述权值数据进行拆分，以得到多个权值子数据；以及以乒乓方式将所述多个权值子数据逐次加载到所述全连接层的输入，以用于所述全连接层运算。5.根据权利要求1所述的推理方法，其中所述待处理张量数据是包括通道维度的多维度张量数据，其中对所述待处理张量数据执行基于最大池化的topk层运算包括：沿所述通道维度对所述待处理张量数据执行k次的最大池化操作，以从所述多个数据元素中获取前预定数目个最大值。6.根据权利要求5所述的推理方法，其中对所述待处理张量数据执行基于最大池化的topk层运算包括：对所述待处理张量数据执行第一转置操作，以便沿所述通道维度对所述待处理张量数据执行基于最大池化的topk层运算；以及对执行所述topk层运算后所得到的结果执行第二转置操作，以获取前预定数目个最大值。7.根据权利要求5或6所述的推理方法，其中沿所述通道维度对所述待处理张量数据执行k次的最大池化操作包括：在每次执行的最大池化操作中，沿所述通道维度选取多个数据元素中的最大值；以及在执行每次的最大池化操作后，将作为最大值而被选取的数据元素进行标识，以便在下一次的最大池化操作中从未标识的数据元素中选取最大值。8.根据权利要求7所述的推理方法，其中每个数据元素具有在所述待处理张量数据内的位置索引，其中将作为最大值而被选取的数据元素进行标识包括：对所述多个位置索引进行最大池化...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人