执行神经网络模型的人工智能处理器、方法及相关产品技术

技术编号：30320373 阅读：22 留言：0更新日期：2021-10-09 23:34

本披露公开了一种执行神经网络模型的人工智能处理器、处理方法及相关产品。该人工智能处理器可以实现为计算装置包括在组合处理装置中，该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互，共同完成用户指定的计算操作。组合处理装置还可以包括存储装置，该存储装置分别与计算装置和其他处理装置连接，用于存储该计算装置和其他处理装置的数据。本披露的方案提供了神经网络模型中的上池化层和深度卷积层的融合处理方案，其可以有效减少片外访存带宽，缓解访存压力，提高机器的处理效率。提高机器的处理效率。提高机器的处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
执行神经网络模型的人工智能处理器、方法及相关产品

[0001]本披露一般地涉及数据处理领域。更具体地，本披露涉及执行神经网络模型的人工智能处理器、芯片、板卡及使用人工智能处理器来执行神经网络模型的方法。

技术介绍

[0002]目前，深度学习(Deep Learning)已经成为机器学习中的重要分支，也大力助推着人工智能(AI)的发展。深度学习的核心技术——深度神经网络(DNN)已在诸多行业有着广泛的应用。
[0003]为了提高神经网络模型的表达能力，DNN不断向着更深或更宽的网络规模发展。然而网络层级的增加也带来了数据IO量大、访存供不上数等问题。因此，为了能充分发挥神经网络模型的优势，需要解决人工智能处理器面临的访存困扰问题。

技术实现思路

[0004]为了至少部分地解决
技术介绍
中提到的一个或多个技术问题，本披露的方案提供了一种执行神经网络模型的人工智能处理器、芯片、板卡及使用人工智能处理器来执行神经网络模型的方法。
[0005]在第一方面中，本披露公开一种执行神经网络模型的人工智能处理器，包括控制电路、运算电路和片上存储电路，所述神经网络模型包括上池化层和深度卷积层，其中：所述控制电路用于控制从片外存储电路向所述片上存储电路加载所述上池化层的输入数据以及所述深度卷积层的卷积核；所述运算电路用于针对所述输入数据和所述卷积核执行所述上池化层和深度卷积层的融合运算，并将融合运算结果写回所述片上存储电路；以及所述控制电路进一步用于控制从所述片上存储电路向所述片外存储电路输出所述融合运算结果...

【技术保护点】

【技术特征摘要】
1.一种执行神经网络模型的人工智能处理器，包括控制电路、运算电路和片上存储电路，所述神经网络模型包括上池化层和深度卷积层，其中：所述控制电路用于控制从片外存储电路向所述片上存储电路加载所述上池化层的输入数据以及所述深度卷积层的卷积核；所述运算电路用于针对所述输入数据和所述卷积核执行所述上池化层和深度卷积层的融合运算，并将融合运算结果写回所述片上存储电路；以及所述控制电路进一步用于控制从所述片上存储电路向所述片外存储电路输出所述融合运算结果。2.根据权利要求1所述的人工智能处理器，其中所述运算电路包括：乘法电路，用于将所述卷积核中深度方向上的各个权值向量分别与所述输入数据的深度方向上的输入向量执行对位乘法运算，得到多个深度方向上的结果向量；以及重排电路，用于根据所述上池化层的池化索引，对所述多个结果向量进行重排，以得到所述融合运算结果。3.根据权利要求2所述的人工智能处理器，其中所述重排电路进一步用于：基于所述池化索引，确定各个所述输入向量的索引；按照索引映射关系，根据所述输入向量的索引确定对应的结果向量的索引；以及按照所述结果向量的索引的顺序，对所述结果向量进行重排，以得到所述融合运算结果。4.根据权利要求3所述的人工智能...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人