【技术实现步骤摘要】
使用差异对比学习网络的半监督目标视频分割方法及系统
[0001]本专利技术涉及视频分割
,具体涉及使用差异对比学习网络的半监督目标视频分割方法及系统。
技术介绍
[0002]半监督目标视频分割任务基于给定的初始帧掩码,把整个视频序列中的目标对象从背景中精细分割出来,实现准确的目标定位,在视频理解、人机交互、自动驾驶等领域有广泛的应用价值和落地需求。但由于视频中目标背景持续变化,同时存在光照变化、相似背景干扰等影响因素,单目标视频分割依然面临很多挑战。
[0003]现有半监督视频分割方法可以分为基于运动传播、检测和模板匹配三类方法。基于运动传播的方法主要利用目标运动和时间相关性,依赖于像素之间的时空关系,目标位置和形状变化相对平滑就可以实现准确分割,但当遇到遮挡或快速运动等时间不连续因素影响时,会导致漂移问题。基于检测的方法不依赖于时间信息,利用初始帧分割结果中的目标信息,学习外观模型,对视频帧中的目标进行检测和分割,在测试序列时,将初始帧图像与其分割结果图分别进行数据增强,以便于训练模型进行调整,从而获得更为准确的实例特征信息,但在线训练带来了很大的计算量。基于模板匹配的方法通过将当前视频帧与初始帧特征进行像素级匹配,根据比对结果对像素进行分割,不会由于累计的传播误差对分割结果产生影响,但其没有充分利用时空信息,且对初始帧特征提取的要求较高。
技术实现思路
[0004]针对现有技术存在上述问题,本专利技术提出了一种使用差异对比学习网络的半监督目标视频分割方法及系统,从特征空间中获得鲁棒且 ...
【技术保护点】
【技术特征摘要】
1.使用差异对比学习网络的半监督目标视频分割方法,其特征在于,包括:第1步:将尺寸为h
×
w的初始视频帧输入骨干网络,得到特征通道数为c的通用视觉特征,然后经过边缘增强卷积处理,得到细节纹理更加清晰的视觉特征将所述视觉特征与分割结果分别相乘并进行尺寸调整得到目标特征和背景特征第2步:提取所述目标特征的全局映射特征第3步:将所述全局映射特征与所述目标特征进行像素级的相似度对比,获取c个通道,尺寸为m
×
n的相似度响应图;第4步:将所述全局映射特征与所述背景特征进行像素级的相似度对比,获取c个通道,尺寸为m
×
n的差异度响应图;第5步:将所述全局映射特征与所述视觉特征进行像素对比,并结合参考帧分割结果,通过卷积的方式,依据全局映射特征与背景特征之间的区分性、与目标之间的相似性,将目标、背景在像素级别区分开,得到目标区域和背景区域第6步:将卷积层参数共享,重复第1步,输入尺寸为h
×
w的后续视频帧通过骨干网络和边缘增强卷积处理,得到视觉特征第7步:将初始帧的全局映射特征与后续帧的视觉特征作为基础,结合参考帧分割结果重复第五步,输出后续帧的分割结果;第8步:重复第6
‑
7步,直到完成整段视频的目标分割任务。2.根据权利要求1所述使用差异对比学习网络的半监督目标视频分割方法,其特征在于,将视觉特征与分割结果分别相乘并进行尺寸调整得到目标特征和背景特征公式为:公式为:3.根据权利要求1所述使用差异对比学习网络的半监督目标视频分割方法,其特征在于,提取所述目标特征的全局映射特征包括全局平均池化和全连接层两部分,分别是:(1)首先对所述目标特征采用J3×
3,c
的卷积核进行全局平均池化处理,输出c维特征向量公式为:
其中,H
average
(x,J
k
×
k,c
,s,p)为平均池化函数,为卷积操作,使用步长s为1,卷积核尺寸k=3的卷积核依次对c个特征通道的像素特征进行池化操作,直到输出c维特征向量(2)将经过全局平均池化处理的c维特征向量输入全连接层,得到全局映射特征公式为:其中,μ为映射系数,η为修正量。4.根据权利要求1所述使用差异对比学习网络的半监督目标视频分割方法,其特征在于,获取c个通道,尺寸为m
×
n的相似度响应图,公式为:n的相似度响应图,公式为:其中,i=1,2,...m,j=1,2,...n;l=1,2,...c;H
standard
为归一化函数,将...
【专利技术属性】
技术研发人员:杨大伟,董美辰,毛琳,张汝波,
申请(专利权)人:大连民族大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。