图像数据处理方法及装置制造方法及图纸

技术编号:32907927 阅读:29 留言:0更新日期:2022-04-07 11:58
本申请涉及一种图像数据处理方法和装置。该方法包括:获取第一图像矩阵A

【技术实现步骤摘要】
图像数据处理方法及装置


[0001]本申请涉及图像处理
,尤其涉及一种图像数据处理方法及装置。

技术介绍

[0002]当前的主流机器翻译主要是基于神经网络机器翻译,这类方法是一个“编码器

解码器”(encoder

decoder)架构的系统,编码器对源语言序列进行编码,并提取信息,然后通过解码器把信息转换为目标语言,完成语言翻译过程。基于“编码器

解码器”架构设计的深度自注意力变换(Transformer)模型凭借其优越的性能,已然成为机器翻译领域的主流模型,在深度学习领域产生了巨大影响。
[0003]而在以Transformer为主要模块的神经网络中,存在两个二维的数据张量进行矩阵相乘的操作,在一些方案中,一般将Transformer模型部署在支持矩阵相乘的芯片中使用。
[0004]但是市面上有些芯片是只支持卷积计算的,这样需要进行矩阵相乘操作的Transformer模块就无法部署在这些芯片上,这就使得Transformer模块的使用受限,灵活性较差。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据处理方法,其特征在于,包括:获取第一图像矩阵A
m
×
p
以及第二图像矩阵B
p
×
n
;确定所述第一图像矩阵A
m
×
p
对应的第一特征图;确定所述第二图像矩阵B
p
×
n
对应的X个卷积核,每个卷积核的大小为f
×
f
×
p,其中,所述f为大于1的整数,所述X为大于或等于1的整数,每个卷积核包含所述第二图像矩阵B
p
×
n
中的一列或多列元素;将所述第一特征图与所述X个卷积核进行卷积得到第二特征图,所述第二特征图与第三图像矩阵对应,所述第三图像矩阵为第一图像矩阵A
m
×
p
以及第二图像矩阵B
p
×
n
进行矩阵相乘得到的结果。2.根据权利要求1所述的图像数据处理方法,其特征在于,所述确定所述第二图像矩阵B
p
×
n
对应的X个卷积核包括:确定所述X个卷积核中的n组目标元素的值,所述n组目标元素中第i组目标元素的值与第二图像矩阵中第i列元素的值对应,所述i为1至n的整数,每个卷积核包含所述n组目标元素中的一组或多组目标元素;确定所述X个卷积核中除了所述n组目标元素以外的其他元素的值为0。3.根据权利要求2所述的图像数据处理方法,其特征在于,每个卷积核包含所述n组目标元素中的一组目标元素Z1,Z2,...,Z
p
,针对每个卷积核,该卷积核包含的目标元素Z1,Z2,...,Z
p
分别位于该卷积核的第1,2,...,p个通道的第j行第k列;所述确定所述第一图像矩阵A
m
×
p
对应的第一特征图包括:确定与所述第一图像矩阵A
m
×
p
的m个行向量对应的m个数据模块,所述数据模块的长度为1,宽度为1,深度为p;按照预设的拼接规则对所述m个数据模块进行拼接得到第三特征图,所述第三特征图的长度为a,宽度为b,深度为p,所述a
×
b=m;在所述第三特征图的上方边缘,下方边缘,左方边缘以及右方边缘分别插入零数据模块得到第一特征图,所述零数据模块的长度为1,宽度为1,深度为p,所述零数据模块中所有元素的值为零。4.根据权利要求2所述的图像数据处理方法,其特征在于,每个卷积核包含所述n组目标元素中的u组目标元素,所述u为大于1且小于或等于f的整数,针对每个卷积核,该卷积核包含的第v组目标元素中的p个目标元素分别位于该卷积核的第1,2...,p个通道的第j
v
行第k
v
列,其中v为1至u的整数;所述确定所述第一图像矩阵A
m
×
p
对应的第一特征图包括:确定与所述第一图像矩阵A
m
×
p
的m个行向量对应的m个数据模块,所述数据模块的长度为1,宽度为1,深度为p;按照预设的拼接规则对所述m个数据模块进行拼接得到第三特征图,所述第三特征图的长度为a,宽度为b,深度为p,所述a
×
b=m;在所述第三特征图的目标位置插入零数据模块得到第一特征图,所述目标位置包括内部位置和边缘位置,所述目标位置与所述多组目标元素在所述卷积核中对应的位置相关,所述零数据模块的长度为1,宽度为1,深度为n,所述零数据模块中所有元素的值为零。5.一种图像数据装置,其特征在于,包括:
获取模块,用于获取第一图像矩阵A
m
×
p
以及第二图像矩阵B

【专利技术属性】
技术研发人员:胡宇姬彬斐刘嘉超刘兰个川
申请(专利权)人:广州小鹏自动驾驶科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1