用于优化神经网络模型的编译方法及其相关产品技术

技术编号：30320836 阅读：25 留言：0更新日期：2021-10-09 23:39

本公开涉及一种用于优化神经网络模型的编译方法、编译器、设备、计算装置和板卡，该计算装置包括在组合处理装置中，该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互，共同完成用户指定的计算操作。组合处理装置还可以包括存储装置，该存储装置分别与计算装置和其他处理装置连接，用于存储该计算装置和其他处理装置的数据。本公开的方案可以显著提升包括人工智能处理器的智能计算系统的计算性能。理器的智能计算系统的计算性能。理器的智能计算系统的计算性能。

全部详细技术资料下载

【技术实现步骤摘要】
用于优化神经网络模型的编译方法及其相关产品

[0001]本公开一般地涉及人工智能领域。更具体地，本公开涉及一种用于优化神经网络模型的编译方法、编译器、用过执行前述编译方法的设备和计算机程序产品、包括前述编译器或设备的集成电路装置，以及包括该集成电路装置的板卡。

技术介绍

[0002]近些年来，随着数据获取难度的下降和硬件算力的大幅提升，深度学习获得了迅猛的发展并且其算法也被广泛应用于各行各业。尽管如此，随着神经网络输入的图片尺寸逐年增长并且网络的参数也随之增长，对于拥有海量参数的网络来说，算力仍然是阻碍算法发展和应用的瓶颈。因此，如何提高硬件算力的利用率和改进网络的运行效率成为了众多算法提供商的优化重点。
[0003]在包括深度学习的神经网络中，算力通常集中在卷积(“conv”)操作中，并且卷积操作中输入的增大通常会带来计算量的指数级增加。为了减少网络的参数量，通常会通过平均池化(“AvgPooling”)操作来对网络的特征进行进一步的提取。由此，在神经网络中经常会出现Conv+AvgPooling的结构。然而，这样的架构存在多种缺陷。首先，由于Conv中存在求和的过程，而AvgPooling本质上也是求和，因此Conv+AvgPooling的结构中存在多余的加法运算，从而造成算力的浪费。其次，Conv计算后的输出结果需要存储到额外的位置。由于Conv输出的大小通常是AvgPooling输出的若干倍，这就使得现有的结构不能充分的利用当前的存储资源，并且这样的方式还增加了I/O带宽，从而导致输出和计算的效率折损...

【技术保护点】

【技术特征摘要】
1.一种用于优化神经网络模型的编译方法，其中所述神经网络模型包括相互连接的卷积层和池化层，所述编译方法由通用处理器来执行,并且包括：获取所述卷积层的卷积参数和权重以及池化层的池化参数；将所述卷积参数和池化参数进行融合，以得到融合参数；根据所述融合参数和池化参数对所述神经网络模型进行优化，以将所述卷积层和池化层转化为融合卷积层,其中所述融合卷积层的融合权重是利用所述融合参数和所述池化参数对卷积层的权重的转换获得；以及将优化后的所述神经网络模型编译成对应的二进制指令序列，以分配至人工智能处理器上执行对应的任务。2.根据权利要求1所述的编译方法，其中所述卷积层的卷积核和所述池化层的池化核的维度包括一维或多维，其中所述卷积参数包括所述卷积核的尺寸参数和步长参数，所述池化参数包括所述池化核的尺寸参数和步长参数，所述融合参数包括融合卷积核的尺寸参数和步长参数，并且其中将所述卷积参数和池化参数进行融合，以得到所述融合参数包括：以维度方向为基准，将所述卷积核的各个维度方向的尺寸参数和步长参数与所述池化核的对应维度方向的尺寸参数和步长参数分别进行融合，以分别得到融合卷积核的尺寸参数和步长参数。3.根据权利要求2所述的编译方法，其中所述维度方向是横向或纵向，并且其中将所述卷积参数和池化参数进行融合，以得到所述融合参数包括：将所述卷积核的横向的尺寸参数和步长参数与所述池化核的横向的尺寸参数和步长参数进行融合，以分别得到融合卷积核的尺寸参数和步长参数；和/或将所述卷积核的纵向的尺寸参数和步长参数与所述池化核的纵向的尺寸参数和步长参数进行融合，以分别得到融合卷积核的尺寸参数和步长参数。4.根据权利要求1
‑
3的任意一项所述的编译方法，其中所述池化层包括平均池化层或求和池化层。5.根据权利要求4所述的编译方法，其中所述池化层为所述平均池化层，并且其中利用所述融合参数和所述池化参数对所述卷积层的权重进行...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人