一种基于广义卷积的图像语义分割方法及系统技术方案

技术编号：37587412 阅读：13 留言：0更新日期：2023-05-18 11:02

本发明专利技术提供一种基于广义卷积的图像语义分割方法及系统，通过下采样的卷积层和深层特征层，将特征层的信息进行像素级还原，该方法建立在广义逆矩阵的数学基础之上，能够利用对卷积矩阵的变换实现信息的像素级恢复。一方面，广义卷积能够恢复特征图大小的性质，可以为图像语义分割领域构建一种新的上采样方法；另一方面，精确矩阵的上采样方式能够让网络的上下采样相互对称，从而在部署时只需微调预测部分的参数。部分的参数。部分的参数。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于广义卷积的图像语义分割方法及系统

[0001]本专利技术属于计算机视觉中语义分割
，尤其涉及一种基于广义卷积的图像语义分割方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]伴随着计算机视觉研究的不断加深，互联网的高速传播与大规模应用使得计算机在生活中扮演着越来越重要的角色，自动驾驶、医学图像分割以及农田分割等依托于计算机的技术不仅解放了人类的部分工作，更是促进了生产力的发展。在此情况下，计算机视觉的准确率与可解释性就变得不可或缺。
[0004]语义分割问题满足了对图像更为准确的分析和理解的要求。图像语义分割的根本目的是通过训练图像的内容，从而确定图像中每个像素的语义类别。如利用全卷积神经网络实现FCN对图像进行像素级的分类，从而解决了语义级别的图像分割问题。FCN可以接受任意尺寸的输入图像，采用反卷积对最后一个卷积层的特征图进行上采样，使它恢复到输入图像的尺寸。
[0005]目前，现有技术大多集中在利用各种函数生成新数据，如双线性插值法和转置卷积，利用自构造函数或计算机生成函数从深层特征层中额外提取信息从而实现上采样的效果，而缺少从网络的下采样过程中寻找丢失的信息。其中，双线性插值法的低通滤波性质容易在计算过程中使得高频分量受损，导致轮廓变得模糊从而丢失小物体的信息；而转置卷积在数学理论层面只能将新特征图恢复至下采样之前的大小，却无法弥补在下采样过程中丢失的信息。也就是说，目前的上采样方式都无法根据下采样...

【技术保护点】

【技术特征摘要】
1.一种基于广义卷积的图像语义分割方法，其特征在于，包括：步骤1：提取输入图像的初始特征图；步骤2：对初始特征图进行下采样操作；步骤3：将步骤2重复k次卷积操作，得到k个表达式；步骤4：将k个表达式进行拼接，得到拼接矩阵；步骤5：通过广义逆矩阵对拼接矩阵还原得到初始特征图；其中，k为卷积操作的次数。2.如权利要求1所述的一种基于广义卷积的图像语义分割方法，其特征在于，所述下采样操作，采用跨步卷积对特征层进行下采样操作。3.如权利要求2所述的一种基于广义卷积的图像语义分割方法，其特征在于，采用跨步卷积对特征层进行下采样操作，包括以下步骤：(1)将原大小为(a,a)的特征图进行展平操作，得到长度为n＝a2的行向量A(1*n)；(2)将大小为(b,b)的卷积核扩展为卷积矩阵P，P的形状为(n,(a
‑
b+1)2)，记作P(n,m)；(3)对原特征图进行AP＝B的计算，A为原特征图展平后的行向量，B为新特征图进行展平后的行向量；(4)由于卷积操作的特殊性，在不添加填充时，n≥m；其中，a表示：原特征图的尺寸大小值；b表示：卷积核的尺寸大小值；n表示：原特征图中信息点个数，即a2；m表示：将卷积核扩展为卷积矩阵后，卷积矩阵的列数。4.如权利要求1所述的一种基于广义卷积的图像语义分割方法，其特征在于，k值的计算方法如下：(1)k从1开始，计算k*m的值；(2)将k*m的值与n进行对比；(3)若n＞k*m，对k进行加1操作并重新返回步骤(1)；(4)若n≤k*m，得到需要的k值，并令q＝k*m，q为将k个卷积矩阵拼接后得到的新矩阵的列数，表示所有新特征图中的信息点总数。5.如权利要求1所述的一种基于广义卷积的图像语义分割方法，其特征在于，所述将步骤2重复k次卷积操作，得到k个表达式，为：对行向量A进行k次跨步卷积，得到k个表达式：AP1＝B1AP2＝B2…
AP
k
＝B
k
其中，P1、P2、
…
、P
k
为第1
‑
k次卷积操作中对应的卷积矩阵；B1、B2、
…
、B
...

【专利技术属性】
技术研发人员：陈振学，叶梦婷，刘成云，黄彬，何为凯，刘龙成，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人