基于掩码指导特征净化的非监督视频目标分割方法技术

技术编号:29758934 阅读:21 留言:0更新日期:2021-08-20 21:12
本发明专利技术公开了一种基于掩码指导的特征净化视频目标分割方法,属于特征学习和图像目标分割技术领域。该方法首先构造训练数据集。使用编码器得到嵌入特征,将嵌入特征输入前向预测解码器生成前向预测掩码。随后使用前向预测编码与嵌入特征对输入进行掩码平均池化操作,得到全局目标特征。将其通过注意力传播操作得到经过前景增强后的嵌入特征并与嵌入特征进行拼接后,输入反馈解码器生成反馈重估计预测掩码。通过融合得到目标分割结果。本发明专利技术保证有意义信息能够输入到解码器中而无用信息被过滤,克服了中层特征忽视语意内容这一缺陷,使神经网络提取的特征在视频目标分割任务上取得了更加优秀的效果。

【技术实现步骤摘要】
基于掩码指导特征净化的非监督视频目标分割方法
本专利技术涉及深度学习领域和视频目标分割领域,尤其是涉及到视频目标分割中的特征表达方法,该方法能够在视频目标分割数据集上得到更加准确的分割结果。
技术介绍
随着多媒体和网络技术的发展,视频已经成为重要的多媒体信息载体。如何从海量的中视频提取有价值的信息,从而完成视频分析以及语意解析,已经成为计算机视觉领域的研究热点。出色的特征表达不仅能够表示视频场景的类别信息,而且能够获取视频的目标语意信息。随着海量的视频数据被采集,如何将视频分析与计算机视觉问题相结合,从而得到出色的特征表达能力是进行视频语意分析的重中之重。现有视频分析任务给社会与学术发展带来便利的同时,也带来了一定的挑战。例如如何有效在缺乏在线指导的情况下,对视频目标进行正确分割以提取视频中关键目标信息,从而应用于视频监控、跟踪领域。缺乏在线指导的非监督视频目标分割在过去一些年在相关领域取得了广泛的研究和长足的进展。目前大量互联网公司和研究机构纷纷投入巨资加入到了非监督视频目标分割任务中,通过上述相关方法完成该任务,这也意味着该任务已经成为了研究的主流。非监督视频目标分割任务具有很高的应用价值,在视频监控方面可以帮助筛选显著运动目标;在自动驾驶方面可以辅助驾驶;在生物医学方面可以帮助医生进行辅助治疗识别等工作。人类具有出色的视觉自我视觉净化能力,其视觉净化机制在一般情况下会遵从预定义的视觉通路,而当反馈信息进入视觉通路时,能够自觉调整通过反馈信息指导的视觉语义信息。除此以外,认知心理学表明,感知语义和注意力信息能够调节神经响应,从而进一步调整从浅层到深层次的侧向连接。从而经过内部分析有选择性地在他们的视觉范围中关注不同目标部位来迭代地反复修正视觉信息,该能力可以视为人类的视觉净化能力。该感知机制能够通过没有外界指导的条件下,多次分析输入信息并对其进行重要性筛选,经过自我反馈修正信息对输入信号进行优先级别划分。在此情况下,优先级别高的信息会被优先处理,从而提升视觉信息处理的效果。其中获得自我反馈修正的方式有多种,针对于分割任务来说,人类通过不断聚焦重估计的过程利用历史注意信息指导后续认知特征的净化,逐步筛选出有价值特征进行后续分割。非监督视频目标分割是计算机视觉中重要的一个基础问题,其目的旨在确定输入视频中主要目标所对应的掩码信息或者目标对应的语义信息。该任务主要面对的挑战在于视频中的遮挡问题以及复杂背景问题等。本方法主要解决在仅有训练集分割标签而缺少任何测试集先验的情况下,进行目标分割。为了完成上述目标,,相关工作通常使用孪生网络提取视频中相关性信息或者使用外部记忆机制来进行完成目标分割任务。但是这些方法首先都需要同时输入多帧的帮助当前帧进行分割,这在一定程度上使计算量加倍;此外这些方法通常都在整个图像上传播信息,而目标在大多数视频中都只占很小的区域,这也会一定程度造成背景扰乱前景的现象。基于以上分析,两种对于真实场景的观测驱动本方法提出了本章模型:1)为了更好地分割图像中的主要目标,人类通常需要从底层到高层且从高层到底层地对语义进行解析。2)在视觉处理的过程中,人眼的聚焦过程可以看成从关注图像整体忽略背景而逐步专注于前景的过程。基于上述真实场景观察,本方法期望将图像自身的中间分割过程看成是得到最终精细分割结果过程中的一个精细语义选择算子,该精细选择算子得益于粗分割结果从而能够达到修正分割结果的效果。
技术实现思路
本专利技术的目的在于,针对上述已有前向神经网络对于视频表达能力的不足,提出了一种基于掩码指导的特征净化非监督视频目标分割方法。本专利技术将净化机制以一种端到端的方式概念化为三个连续的模块化方法来解决目标分割问题。该方法与现有方法的不同在于探索了分割掩码和中间特征表达之间的内在联系,从而保证有意义信息能够输入到解码器中而无用信息被过滤。以这种方式实现净化仿了“聚焦和净化”过程,克服了“堆叠不同类型的前向网络层造成的忽视语意内容和蕴涵在分割掩码中的任务指定因素”这一缺陷。本章提出的掩码指导的特征净化机制能够以迭代的方式帮助量化目标的中间特征表达,从而使模型能够基于历史的特征表达和任务目标选择关注的目标区域。实现本专利技术方法的主要思路是:首先通过图像数据集及其对应目标分割结果构造训练图像数据集。将图像输入编码网络得到该图像对应的嵌入特征,将嵌入特征输入前向解码器生成前向预测掩码。随后使用前向预测掩码与嵌入特征对输入的两者进行掩码平均池化操作,得到初始预测指导目标的全局目标特征并将其上采样到与嵌入特征同样尺寸。将其通过使用注意力传播操作得到经过前景增强后的嵌入特征,与嵌入特征进行稠密比较操作,随后输入反馈解码器生成反馈重估计预测掩码,最后融合得到最终的目标分割结果。根据上述主要思路,本专利技术方法的具体实现包括如下步骤,包括训练和测试两个阶段,训练阶段包括步骤1-6步骤1:构造数据集构造数据集,以视频帧为输入,视频帧对应分割掩码为训练目标,构造出训练视频对应的目标分割图像集;步骤2:提取输入视频帧的嵌入特征和前向预测掩码将视频帧输入特征编码网络,提取视频帧对应的嵌入特征,随后将该嵌入特征输入前向解码网络,解码得到该视频帧的前向预测掩码;步骤3:使用掩码平均池化得到全局目标特征将步骤2得到的前向预测掩码进行双线性插值操作缩放为与嵌入特征相同尺寸大小,随后对步骤2得到的嵌入特征与经过缩放后的前向预测解码进行哈达马乘积操作,计算特征对应每个通道非零区域的平均值并将其进行上采样操作到与嵌入特征相同尺寸,得到全局目标特征。步骤4:通过注意力传播得到增强嵌入特征使用步骤3的到的全局目标特征与步骤2得到的嵌入特征计算得到相似性矩阵。将该相似性矩阵与嵌入特征进行矩阵相乘操作,得到增强嵌入特征。步骤5:嵌入特征与增强嵌入特征拼接融合并进行净化重估计拼接嵌入特征与增强嵌入特征实现拼接,使用卷积操作将两者进行融合。随后将融合后的特征输入到净化重估计解码器,解码得到净化重估计掩码。步骤6:计算分割损失,更新分割网络参数将步骤2计算前向预测掩码和净化重估计掩码分别与分割目标计算损失,并方向传播更新分割网络权重。实测阶段步骤7:输出视频目标分割结果针对输入视频帧将其输入分割网络,将步骤2得到的前向预测掩码与步骤5得到的净化重估计掩码进行融合,得到最终目标分割结果。本专利技术与现有技术相比,具有以下明显的优势和有益效果:本专利技术提出了一种基于掩码指导的特征净化非监督视频目标分割方法,深度探索了分割掩码和中间特征表达之间的内在联系,从而保证有意义信息能够输入到解码器中而无用信息被过滤。以这种方式实现了目标聚焦和特征净化过程,克服了传统前向网络造成的中层特征忽视语意内容这一缺陷,进一步提升了神经网络针对视频目标分割任务的特征学习和表达能力,从而使得训练出神经网络提取的特征在视频目标分割任务上取得了更加优秀的效果。附图说明图1为本专利技术所涉及方法总流程框图;图2为本专利技术所涉及算法总架构图;本文档来自技高网
...

【技术保护点】
1.基于掩码指导的特征净化非监督视频目标分割方法,其特征在于包括训练和测试两个阶段,/n分割网络训练阶段包括:/n步骤1:构造数据集/n以视频帧为输入,视频帧对应分割掩码为训练目标,构造出训练视频对应的目标分割图像集,其中,构造训练集的视频帧和其对应的目标分割标注记为为

【技术特征摘要】
1.基于掩码指导的特征净化非监督视频目标分割方法,其特征在于包括训练和测试两个阶段,
分割网络训练阶段包括:
步骤1:构造数据集
以视频帧为输入,视频帧对应分割掩码为训练目标,构造出训练视频对应的目标分割图像集,其中,构造训练集的视频帧和其对应的目标分割标注记为为It表示视频帧RGB图像,Yt表示It对应的分割标注;
步骤2:提取输入视频帧的嵌入特征X和前向预测掩码SF;
步骤3:使用掩码平均池化得到全局目标特征VFG;
步骤4:通过注意力传播得到增强嵌入特征
步骤5:嵌入特征X与增强嵌入特征稠密比较并进行净化重估计,生成净化重估计掩码SB;
步骤6:计算分割损失,更新分割网络参数
分割网络实测阶段包括:
步骤7:分割网络训练完成后,重复步骤2-5,步骤2和步骤5分别得到前向预测掩码SF和净化重估计掩码SB,计算两者平均值,得到最终视频目标分割结果。


2.根据权利要求1所述的基于掩码指导的特征净化非监督视频目标分割方法,其特征在于:步骤2具体为:
从中选择一个RGB图像表示为I,利用编码器Encoder提取输入嵌入特征X,表示如下,
X=Encoder(I)
其中H和W表示输入图像的高和宽,c表示嵌入特征的通道数,h和w表示嵌入特征的高和宽;
将嵌入特征X输入前向预测解码器DF生成前向预测掩码SF∈[0,1]1*h*w,表示如下,
SF=σ(DF(X))
其中σ表示sigmoid函数。


3.根据权利要求1所述的基于掩码指导的特征净化非监督视频目标分割方法,其特征在于:步骤3具体为:
对SF进行双线性插值操作,获得与嵌入特征X相同尺寸的大小,记为
使用掩码平均池化的方法来提取目标特征,公式如下:


...

【专利技术属性】
技术研发人员:段立娟恩擎王文健乔元华
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1