【技术实现步骤摘要】
一种基于非模态实例分割的图像非可见区域补全方法
[0001]本专利技术涉及计算机视觉
,尤其涉及一种基于非模态实例分割的图像非可见区域补全方法
。
技术介绍
[0002]利用计算机视觉技术进行场景理解,会存在许多物体被遮挡甚至物体之间相互遮挡的情况,在物体局部被遮挡的情景下,人类可以根据先验知识感知被遮挡物体的完整形态,描述被遮挡区域的边界信息,具有从可见的物体形态收集先验信息并推断不可见线索的能力,这种能力被称为非模态
(Amodal)
预测
。
随着深度学习技术的普及,各领域的图像分类
、
目标检测
、
图像分割等视觉技术飞速发展,甚至在预测和识别可见物体的能力已超过人类的视觉系统
。
但上述技术主要用于图像中可见区域的预测,尚缺乏对图像中非可见区域的预测能力
。
而补全图像中非可见部分形态,有助于将无序的
、
碎片化的
、
不完整的对象组成连贯
、
完整的场景
。
[0003]预测图像中非可见区域形状的能力,可以在实际应用场景中解决许多问题
。
比如在农业领域,开发适用于植物果实采摘的机器视觉系统时,对非可见区域的预测可以使机器人能够在复杂
、
杂乱的场景中抓取和操纵隐藏在背后的物体
。
恢复被遮挡物体的完整形态的最常用的方法是非模态实例分割方法,其核心思想是分割出物体可见区域与非可见区域的联 ...
【技术保护点】
【技术特征摘要】
1.
一种基于非模态实例分割的图像非可见区域补全方法,其特征在于:建立基于
Swin Transformer
的弱监督学习的非模态实例分割模型,在改进的
Swin Transformer Unet
分割网络上训练出非可见区域补全网络,从而无需人工注释被遮挡区域的掩膜;同时引入
ASBUNet
中的遮挡边界估计,重新设计在遮挡区域和可见区域的预测权重,引入对抗式生成学习的思想,将预测的非可见区域掩膜送入鉴别器中,添加对抗生成的鉴别器损失函数,改良鉴别器输出的掩膜形状
。2.
根据权利要求1所述的一种基于非模态实例分割的图像非可见区域补全方法,其特征在于:包括以下步骤:步骤1:获取
RGB
图像数据集,并进行图像预处理;步骤2:对图像数据集中的图像进行标注,构建训练集和验证集;步骤3:构建基于
Swin Transformer
的弱监督学习的非模态实例分割模型;所述非模态实例分割模型包括4×4卷积核
、
线性层
、
编码器
、
解码器和鉴别器;步骤4:通过三个阶段训练非模态实例分割模型,确定最优模型参数;步骤5:测试非模态实例分割模型补全能力和遮挡顺序预测能力
。3.
根据权利要求1所述的一种基于非模态实例分割的图像非可见区域补全方法,其特征在于:所述步骤1的具体方法为:获取
RGB
图像数据;根据获取的图像,采用计算余弦相似度的方式去除重复度大于设定阈值的图片,计算图片拉普拉斯变换的方差值来去除模糊程度大于设定阈值的图片,然后筛选删除含有杂乱背景和拍摄角度不佳的图片
。4.
根据权利要求2所述的一种基于非模态实例分割的图像非可见区域补全方法,其特征在于:所述步骤2的具体方法为:采用
Labelme
工具注释图像语义标签,结合场景结构,对图像中可见和不可见部分均进行语义标注;针对未被遮挡的对象,采用长度掩膜标注方式;而针对被遮挡的对象,则采用分层级标注方式,第一层标注可见部分的区域,第二层标注出不可见部分的区域,第三层标注可见区域与非可见区域的联合区域,得到非模态真值标签;按照9:1比例构建训练集和验证集,经过水平翻转,平移和随机裁剪,将训练集增强
。5.
根据权利要求2所述的一种基于非模态实例分割的图像非可见区域补全方法,其特征在于:步骤3所述非模态实例分割模型使用图像的遮挡边界和可见部分的掩膜作为模型的输入;首先使用4×4卷积核对图像行卷积操作,得到一个包含
96
个通道的张量;然后,在模型中应用线性层进行维度转换;经过线性层后,图像就变成了一系列被分割的特征,这些特征将被进一步输入编码器;所述编码器和解码器均采用了基于改进的
Swin Transformer Unet
对称架构的
Swin Transformer Block
;改进的
Swin Transformer Unet
作为整个非模态实例分割模型的分割网络主干,编码器通过四个采样层收集浅层特征;然后,这些浅层特征通过跳转连接与解码器收集的深层特征融合;解码器中加入对可见区域掩膜和非可见区域掩膜预测的联合权重,用于对模型损失函数进行调整;鉴别器中引入对抗式生成学习思想,对解码器预测出来的不可见区域掩膜判断并改善掩膜形态
。6.
根据权利要求5所述的一种基于非模态实例分割的图像非可见区域补全方法,其特征在于:所述非模态实例分割模型采用边界估计的方法将遮挡物与被遮挡物的接触边界以掩膜的形式输入到模型中,模型会输出被遮挡部分的另一边的具有不确定性的边界图;在
两部分边界中的内容会得到像素填充,以得到合理的形状
。7.
根据权利要求6所述的一种基于非模态实例分割的图像非可见区域补全方法,其特征在于:所述非模态实例分割模型采用部分补全的算法实现非模态掩膜补全的弱监督学习过程;基于让模型自主学习恢复不可见掩膜的思想,在训练阶段,对图像进行处理,随机采样出遮挡实例和被遮挡实例,并且只使用它们的可见掩膜进行模型训练,具体为:随机选择两张存在遮挡关系的图像,将含有实例
A
的图像...
【专利技术属性】
技术研发人员:邓寒冰,杨景,苗腾,周云成,吴琼,
申请(专利权)人:沈阳农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。