【技术实现步骤摘要】
边界卷积计算方法、装置、硬件加速器及计算机设备
本申请涉及卷积神经网络
,尤其涉及一种边界卷积计算方法、装置、硬件加速器及计算机设备。
技术介绍
对图像进行卷积运算时,通常会令卷积核矩阵在图像上滑动,同时求取卷积核矩阵与图像中对应元素的相乘累加结果。实际计算时,由于执行卷积计算的硬件加速器尺寸有限,无法一次性完成整个图像的计算,通常一次仅针对部分图像执行卷积计算,计算完毕后加载下一部分图像再执行卷积计算。通常,位于图像边界处的元素并不能被卷积操作到,原因在于边界的元素没有完全跟卷积核重叠。参见图1,若卷积核的大小为3×3(图中灰色部分),硬件加速器一次能够针对8×8大小的图像执行卷积计算,首次计算时,硬件加速器会加载出第1-8行及第1-8列的图像,卷积核按照每次一步从左到右在图像中进行滑动,每次覆盖图像中3行3列的元素,当滑到第6、7、8列时,便不会继续向右滑动。针对下一部分图像(第9-16行及第9至16列)进行卷积计算时,卷积核一开始便覆盖图像中的第9、10、11列,这种情况下,图像第7、8、9列及图像第8、 ...
【技术保护点】
1.一种边界卷积计算方法,其特征在于,包括:/n加载当前图像;/n判断所述当前图像是否为整个图像的第一部分图像;/n若是,则执行以下操作:/n针对所述当前图像的第一边界元素执行第一局部卷积计算,并将所述当前图像的第一局部卷积计算的结果存储至内部存储模块,所述第一边界元素为所述当前图像中倒数n-1行和/或倒数n-1列的元素,n为卷积核的大小;/n若不是,则执行以下操作:/n针对所述当前图像的第一边界元素执行第一局部卷积计算,并将所述第一局部卷积计算的结果存储至内部存储模块;/n针对所述当前图像的第二边界元素执行第二局部卷积计算,所述第二边界元素为所述当前图像中正数n-1行和/ ...
【技术特征摘要】
1.一种边界卷积计算方法,其特征在于,包括:
加载当前图像;
判断所述当前图像是否为整个图像的第一部分图像;
若是,则执行以下操作:
针对所述当前图像的第一边界元素执行第一局部卷积计算,并将所述当前图像的第一局部卷积计算的结果存储至内部存储模块,所述第一边界元素为所述当前图像中倒数n-1行和/或倒数n-1列的元素,n为卷积核的大小;
若不是,则执行以下操作:
针对所述当前图像的第一边界元素执行第一局部卷积计算,并将所述第一局部卷积计算的结果存储至内部存储模块;
针对所述当前图像的第二边界元素执行第二局部卷积计算,所述第二边界元素为所述当前图像中正数n-1行和/或正数n-1列的元素;
从所述内部存储模块中取出目标邻近图像的第一局部卷积计算结果,其中,所述目标邻近图像为与所述当前图像相邻的图像,所述目标邻近图像与所述当前图像之间不存在重复的元素;
将所述当前图像的第二局部卷积计算结果与所述目标邻近图像的第一局部卷积计算进行相加合并,获得所述当前图像与所述目标邻近图像之间边界元素的卷积计算结果。
2.根据权利要求1所述的边界卷积计算方法,其特征在于,所述针对所述当前图像的第一边界元素执行第一局部卷积计算,包括:
若所述第一边界元素为所述当前图像中倒数n-1行的元素,则针对所述当前图像中倒数n-1行的元素与所述卷积核中正数n-1行的元素执行卷积操作;
或者,若所述第一边界元素为所述当前图像中倒数n-1列的元素,则针对所述当前图像中倒数n-1列的元素与所述卷积核中正数n-1列的元素执行卷积操作;
或者,若所述第一边界元素为所述当前图像中倒数n-1行及倒数n-1列的元素,则针对所述当前图像中倒数n-1行的元素与所述卷积核中正数n-1行的元素执行卷积操作,及针对所述当前图像中倒数n-1列的元素与所述卷积核中正数n-1列的元素执行卷积操作。
3.根据权利要求2所述的边界卷积计算方法,其特征在于,所述针对所述当前图像中倒数n-1行的元素与所述卷积核中正数n-1行的元素执行卷积操作,包括:
分别针对所述当前图像中倒数n-m行的元素与所述卷积核中正数n-m行的元素执行相乘累加操作,其中,m为小于n的正整数;
所述针对所述当前图像中倒数n-1列的元素与所述卷积核中正数n-1列的元素执行卷积操作,包括:
分别针对所述当前图像中倒数n-m列的元素与所述卷积核中正数n-m列的元素执行相乘累加操作。
4.根据权利要求2所述的边界卷积计算方法,其特征在于,所述针对所述当前图像的第二边界元素执行第二局部卷积计算,包括:
若所述第二边界元素为所述当前图像中正数n-1行的元素,则针对所述当前图像中正数n-1行的元素与所述卷积核中倒数n-1行的元素执行卷积操作;
或者,若所述第二边界元素为所述当前图像中正数n-1列的元素,则针对所述当前图像中正数n-1列的元素与所述卷积核中倒数n-1列的元素执行卷积操作;
或者,若所述第二边界元素为所述当前图像中正数n-1行及正数n-1列的元素,则针对所述当前图像中正数n-1行的元素与所述卷积核中倒数n-1行的元素执行卷积操作,及针对所述当前图像中正数n-1列的元素与所述卷积核中倒数n-1列的元素执行卷积操作。
5.根据权利要求4所述的边界卷积计算方法,其特征在于,所述针对所述当前图像中正数n-1行的元素与所述卷...
【专利技术属性】
技术研发人员:陶为,林军,秦子迪,周谦,
申请(专利权)人:南京风兴科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。