基于掩码指导特征净化的非监督视频目标分割方法技术

技术编号：29758934 阅读：21 留言：0更新日期：2021-08-20 21:12

本发明专利技术公开了一种基于掩码指导的特征净化视频目标分割方法，属于特征学习和图像目标分割技术领域。该方法首先构造训练数据集。使用编码器得到嵌入特征，将嵌入特征输入前向预测解码器生成前向预测掩码。随后使用前向预测编码与嵌入特征对输入进行掩码平均池化操作，得到全局目标特征。将其通过注意力传播操作得到经过前景增强后的嵌入特征并与嵌入特征进行拼接后，输入反馈解码器生成反馈重估计预测掩码。通过融合得到目标分割结果。本发明专利技术保证有意义信息能够输入到解码器中而无用信息被过滤，克服了中层特征忽视语意内容这一缺陷，使神经网络提取的特征在视频目标分割任务上取得了更加优秀的效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于掩码指导特征净化的非监督视频目标分割方法
本专利技术涉及深度学习领域和视频目标分割领域，尤其是涉及到视频目标分割中的特征表达方法，该方法能够在视频目标分割数据集上得到更加准确的分割结果。
技术介绍
随着多媒体和网络技术的发展，视频已经成为重要的多媒体信息载体。如何从海量的中视频提取有价值的信息，从而完成视频分析以及语意解析，已经成为计算机视觉领域的研究热点。出色的特征表达不仅能够表示视频场景的类别信息，而且能够获取视频的目标语意信息。随着海量的视频数据被采集，如何将视频分析与计算机视觉问题相结合，从而得到出色的特征表达能力是进行视频语意分析的重中之重。现有视频分析任务给社会与学术发展带来便利的同时，也带来了一定的挑战。例如如何有效在缺乏在线指导的情况下，对视频目标进行正确分割以提取视频中关键目标信息，从而应用于视频监控、跟踪领域。缺乏在线指导的非监督视频目标分割在过去一些年在相关领域取得了广泛的研究和长足的进展。目前大量互联网公司和研究机构纷纷投入巨资加入到了非监督视频目标分割任务中，通过上述相关方法完成该任务，这也意味着该任务已经成为了研究的主流。非监督视频目标分割任务具有很高的应用价值，在视频监控方面可以帮助筛选显著运动目标；在自动驾驶方面可以辅助驾驶；在生物医学方面可以帮助医生进行辅助治疗识别等工作。人类具有出色的视觉自我视觉净化能力，其视觉净化机制在一般情况下会遵从预定义的视觉通路，而当反馈信息进入视觉通路时，能够自觉调整通过反馈信息指导的视觉语义信息。除此以外，认知心理学表明，感知语义和注意力信...

【技术保护点】
1.基于掩码指导的特征净化非监督视频目标分割方法，其特征在于包括训练和测试两个阶段，/n分割网络训练阶段包括：/n步骤1：构造数据集/n以视频帧为输入，视频帧对应分割掩码为训练目标，构造出训练视频对应的目标分割图像集，其中，构造训练集的视频帧和其对应的目标分割标注记为为

【技术特征摘要】
1.基于掩码指导的特征净化非监督视频目标分割方法，其特征在于包括训练和测试两个阶段，
分割网络训练阶段包括：
步骤1：构造数据集
以视频帧为输入，视频帧对应分割掩码为训练目标，构造出训练视频对应的目标分割图像集，其中，构造训练集的视频帧和其对应的目标分割标注记为为It表示视频帧RGB图像，Yt表示It对应的分割标注；
步骤2：提取输入视频帧的嵌入特征X和前向预测掩码SF；
步骤3：使用掩码平均池化得到全局目标特征VFG；
步骤4：通过注意力传播得到增强嵌入特征
步骤5：嵌入特征X与增强嵌入特征稠密比较并进行净化重估计，生成净化重估计掩码SB；
步骤6：计算分割损失，更新分割网络参数
分割网络实测阶段包括：
步骤7：分割网络训练完成后，重复步骤2-5，步骤2和步骤5分别得到前向预测掩码SF和净化重估计掩码SB，计算两者平均值，得到最终视频目标分割结果。

2.根据权利要求1所述的基于掩码指导的特征净化非监督视频目标分割方法，其特征在于：步骤2具体为：
从中选择一个RGB图像表示为I，利用编码器Encoder提取输入嵌入特征X，表示如下，
X＝Encoder(I)
其中H和W表示输入图像的高和宽，c表示嵌入特征的通道数，h和w表示嵌入特征的高和宽；
将嵌入特征X输入前向预测解码器DF生成前向预测掩码SF∈[0,1]1*h*w，表示如下，
SF＝σ(DF(X))
其中σ表示sigmoid函数。

3.根据权利要求1所述的基于掩码指导的特征净化非监督视频目标分割方法，其特征在于：步骤3具体为：
对SF进行双线性插值操作，获得与嵌入特征X相同尺寸的大小，记为
使用掩码平均池化的方法来提取目标特征，公式如下：

...

【专利技术属性】
技术研发人员：段立娟，恩擎，王文健，乔元华，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人