【技术实现步骤摘要】
本申请涉及人工智能领域的数据处理技术,尤其涉及一种卷积运算加速器及相关方法。
技术介绍
1、近年来,随着深度神经网络、异构计算、高带宽高存储密度、大数据、云计算等技术的突破,人工智能的应用迅猛发展,走进大众生活的方方面面。当前的人工智能很大一部分的计算就是各种神经网络的运算,而卷积计算占据了整个神经网络的大部分计算量和数据吞吐量。由于各种人工智能(artificial intelligence,ai)设备的遍及,云端大数据分析计算对ai加速的饥渴需求,神经网络的计算,特别是对卷积的计算能力、计算效率的提升问题日显突出。卷积神经网络的主要组成部分为卷积计算,占据整个卷积神经网络95%以上计算量。
2、因此,如何提高卷积计算的效率,达到显著的提高神经网络算法的应用效果成为亟待解决的问题。
技术实现思路
1、本申请实施例所要解决的技术问题在于,提供一种卷积运算加速器及相关方法,以提高卷积计算的效率,达到显著的提高神经网络算法的应用效果。
2、第一方面,本申请实施案例提供一
...【技术保护点】
1.一种卷积运算加速器,其特征在于,所述卷积运算加速器包括处理单元、第一数据加载器和第二数据加载器,其中,所述处理单元,用于:
2.如权利要求1所述的加速器,其特征在于,所述目标算子集合包括K*L个目标算子,且所述K*L个目标算子呈K行,L列分布,其中,K行中的每行目标算子中相邻的目标算子相连接,且第L列目标算子中相邻的目标算子相连接;所述第一数据加载器,具体用于:
3.如权利要求2所述的加速器,其特征在于,在M=K时,所述AK*L和输入矩阵BM*N的卷积关系为第i个第一行向量与第i个第二行向量对应;所述第二数据加载器,具体用于:
...
【技术特征摘要】
1.一种卷积运算加速器,其特征在于,所述卷积运算加速器包括处理单元、第一数据加载器和第二数据加载器,其中,所述处理单元,用于:
2.如权利要求1所述的加速器,其特征在于,所述目标算子集合包括k*l个目标算子,且所述k*l个目标算子呈k行,l列分布,其中,k行中的每行目标算子中相邻的目标算子相连接,且第l列目标算子中相邻的目标算子相连接;所述第一数据加载器,具体用于:
3.如权利要求2所述的加速器,其特征在于,在m=k时,所述ak*l和输入矩阵bm*n的卷积关系为第i个第一行向量与第i个第二行向量对应;所述第二数据加载器,具体用于:
4.如权利要求3所述的加速器,其特征在于,所述处理单元,具体用于:
5.如权利要求1所述的加速器,其特征在于,所述目标算子集合包括s*q个目标算子,且所述s*q个目标算子呈s行,q列,s=k*l,q为大于1的整数,其中,q列目标算子中的每列目标算子中的相邻目标算子相连接;所述第一数据加载器,具体用于:
6.如权利要求5所述的加速器,其特征在于,在m>k时,所述ak*l和所述bm*n的卷积关系包括m-k+1个卷积子关系,每个所述卷积子关系为对应输入子矩阵中的k个第二行向量与一列目标算子中加载的k个第一行向量的对应关系,其中,所述输入子矩阵为所述bm*n中m-k+1个输入子矩阵中的任意一个,每个所述输入子矩阵中包括所述m个第二行向量中相邻的k个第二行向量,且相邻输入子矩阵中包括k-1个相同的第二行向量;所述第二数据加载器,具体用于:
7.如权利要求6所述的加速器,其特征在于,所述处理单元,具体用于:
8.一种卷积运算方法,其特征在于,应用于卷积运算加速器,所述卷积运算加速器包括处理单元、第一数据加载器和第二数据加载器,所述方法包括:
9.如权利要求8所述的方法,其特征在于,所述目标算子集合包括k*l个目标算子,且所述k*l个目标算子呈k行,l列分布,其中,k行中的每行目标算子中相...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。