基于图像数据处理的卷积运算方法、装置、处理器及介质制造方法及图纸

技术编号:37290774 阅读:31 留言:0更新日期:2023-04-21 02:38
本发明专利技术实施例公开了一种基于图像数据处理的卷积运算方法、装置、处理器及介质,包括:获取待运算的输入图像矩阵,并根据执行并行度,确定对输入图像矩阵进行卷积运算时的执行区域;根据执行区域,以及卷积运算中的卷积核大小,确定与执行区域对应的运算数据的数据坐标;根据数据坐标,在缓存区中检测是否存在缓存命中数据;若是,则在缓存区中获取运算数据;若否,则在内存中加载运算数据;将运算数据与卷积核进行卷积运算,得到卷积结果。该方法根据执行并行度确定输入图像矩阵的加载规则并加载运算数据,有效缩短卷积运算数据加载时间,节省存储空间;并且优先在缓存命中运算数据,避免重复数据多次由内存加载,提高数据利用率及加载效率。用率及加载效率。用率及加载效率。

【技术实现步骤摘要】
基于图像数据处理的卷积运算方法、装置、处理器及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于图像数据处理的卷积运算方法、装置、处理器及介质。

技术介绍

[0002]在人工智能、神经网络等领域中,卷积运算是一种有效筛选图片特征的方式,例如通过卷积运算实现特征提取、特征选择或者信息过滤等。卷积的一般场景是采用正方形的卷积核,遍历图像中的各个点,卷积核与覆盖区域的点进行内积运算。
[0003]现有技术中,通常是按照卷积核大小以及遍历轨迹,将原始图像在内存中进行完全展开,并加载输入图像展开矩阵,与卷积核展开矩阵进行卷积运算。例如,原始图像矩阵大小为M
×
N
×
Cin,M和N为原始图像大小,Cin为输入特征层数;卷积核矩阵阵列大小为Kw
×
Kh
×
Cout,Kw
×
Kh为卷积核大小,Cout为卷积的输出特征层数;如在边界填充(padding)和步长(step)均取1时,原始图像矩阵进行卷积计算时,展开后的输入展开矩阵大小为M
×<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像数据处理的卷积运算方法,其特征在于,包括:获取待运算的输入图像矩阵,并根据执行并行度,确定对所述输入图像矩阵进行卷积运算时的执行区域;根据所述执行区域,以及卷积运算中的卷积核大小,确定与所述执行区域对应的运算数据的数据坐标;根据所述数据坐标,在缓存区中检测是否存在缓存命中数据;若是,则在缓存区中获取所述运算数据;若否,则在内存中加载所述运算数据;将所述运算数据与卷积核进行卷积运算,得到卷积结果。2.根据权利要求1所述的方法,其特征在于,根据所述执行区域,以及卷积运算中的卷积核大小,确定与所述执行区域对应的运算数据的数据坐标,包括:在所述执行区域中,确定各执行点的坐标信息;根据各所述坐标信息以及卷积运算中的卷积核大小,确定所述执行区域中各执行点对应的运算数据的数据坐标。3.根据权利要求2所述的方法,其特征在于,根据各所述坐标信息以及卷积运算中的卷积核大小,确定所述执行区域中各执行点对应的运算数据的数据坐标,包括:在所述执行区域中,确定至少一个目标执行点,以及与所述目标执行点对应的目标坐标信息;根据所述目标坐标信息、所述目标执行点与所述执行区域中其他执行点之间的位置关系、以及卷积运算中的卷积核大小,确定所述执行区域中各执行点对应的运算数据的数据坐标。4.根据权利要求3所述的方法,其特征在于,根据所述目标坐标信息、所述目标执行点与所述执行区域中其他执行点之间的位置关系、以及卷积运算中的卷积核大小,确定所述执行区域中各执行点对应的运算数据的数据坐标,包括:根据所述目标执行点的坐标信息,在所述输入图像矩阵中以所述目标执行点为中心,确定与所述卷积核大小相同的区域对应的第一执行点展开矩阵坐标;根据所述目标执行点的坐标信息、以及所述目标执行点与所述执行区域中其他执行点之间的位置关系,依次以各所述其他执行点为中心,确定与所述卷积核大小相同的区域对应的第二执行点展开矩阵坐标;将所述第一执行点展开矩阵坐标和各所述第二执行点展开矩阵坐标,作为所述运算数据的数据坐标。5.根据权利要求2所述的方法,其特征在于,根据所述数据坐标,在缓存区中检测是否存在缓存命中数据;若是,则在缓存区中获取所述...

【专利技术属性】
技术研发人员:阙恒王斐商秋王锋
申请(专利权)人:砺算科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1