基于多数据集协作学习的视频显著性区域检测方法技术

技术编号:37417174 阅读:7 留言:0更新日期:2023-04-30 09:40
本发明专利技术公开了一种基于多数据集协作学习的视频显著性区域检测方法。所述方法包括如下步骤:获取多个分布不同的视频显著性数据集;构建多数据集协作网络,通过数据集特定单元以建模多数据集的统计特性,通过数据集对抗模块以促使网络学习具备显著性特征的共性,二者联合来缓解数据集之间分布差异问题;针对不同的应用场景,提出相对应的多数据集训练和测试方式,并采用复合批次训练机制以优化协作学习过程。所述方法区别于常见的单数据集或微调训练模式,利用多个数据集的信息来提升视频显著性区域检测精度,并提高模型在域外数据上的泛化表现。表现。表现。

【技术实现步骤摘要】
基于多数据集协作学习的视频显著性区域检测方法


[0001]本专利技术涉及图像通信方法
,尤其涉及一种基于多数据集协作学习的视频显著性区域检测方法。

技术介绍

[0002]视频显著性区域检测是视频处理和计算机视觉中的基本任务之一,也是感知视频编码中重要的预处理任务。它旨在模拟人类视觉注意系统,预测人类自由观看视频时对各个视频区域的关注程度,以显著性图的形式表达出来。在感知视频编码中,首先进行视频显著性区域的捕获,然后把比特资源更多的分配给显著性区域,使得显著性区域保持高清,而非显著性区域适当失真,以达到在主观视觉感知不变的情况下降低视频码率,提升视频压缩率,进而缩减视频存储空间,减轻视频通信的带宽负担。
[0003]随着深度学习的发展,视频显著性区域检测领域取得很大的进步,但是大多数的视频显著性检测模型都是以单数据集或微调方式进行训练的。由于单个数据集的数据量有限,其检测精度趋近饱和,且缺乏足够的泛化能力,阻碍了这些模型在现实生活中的应用。利用多个数据集进行训练扩充了训练数据量,看似可以解决以上问题,但是数据集之间常常存在分布偏差,直接在多数据集上训练得到的模型常常还不如单数据集或者微调模型下的结果。由此可见,如何解耦数据集间的分布差异,建模具有显著信息的共性特征是有效进行多数据集训练的关键。

技术实现思路

[0004][0005]本专利技术为了解决现有方法中的上述问题,提出一种基于多数据集协作学习的视频显著性区域检测方法。
[0006]一种基于多数据集协作学习的视频显著性区域检测方法,其特征在于包括如下步骤:S1:获取多个带有标签的视频显著性数据集,其中,多个数据集的样本和标签分布不同; S2:构建多数据集协作网络,利用多数据集的信息来获取输入视频的显著图。该网络由3D卷积主干网络的编码器,特征融合模块,数据集特定单元,数据集对抗模块和解码器组成。其中,数据集特定单元包含数据集特定批归一化操作,数据集特定高斯先验图和数据集特定高斯光滑滤波器,用以建模每个数据集的统计特性;数据集对抗模块用以判断输入样本的数据集标签,产生分类损失,以对抗学习的形式促使网络学习具备显著性特征的共性;数据集特定单元和数据集对抗模块协同工作,可以建模多个数据集的统计特性与显著共性,共同来缓解多个数据集之间的分布差异问题;S3:针对域内场景,采用通用方式进行训练和测试;针对未给标签的目标域,采用领域自适应方式进行训练和测试;针对未知目标域,采用领域泛化方式进行训练和测试;并
采用复合批次训练机制来辅助多数据集协作网络训练。
[0007]进一步的技术方案在于,数据集特定单元为每个数据集设置了相应的分支,根据输入数据集的标签,自动切换开关以激活相应的分支,从而建模数据集专属特征;其具体应用分为数据集特定批归一化操作,数据集特定高斯先验图和数据集特定高斯光滑滤波器;针对跨数据集的批归一化参数分布不同,数据集特定批归一化操作为通过训练来学习每个数据集的批归一化均值与方差;针对数据集之间的高斯先验图不同,数据集特定高斯先验图为每个数据集构建不同的二维高斯先验图,用以建模每个数据集的中心注视偏差;针对数据集之间的显著图清晰度不同,采用可学习的数据集特定高斯光滑滤波器来消除此偏差。
[0008]进一步的技术方案在于,数据集对抗模块是由梯度反转层和数据集分类器组成;数据集分类器由卷积层和全连接层组成,用于预测输入视频所属数据集,其损失函数为多分类交叉熵损失;梯度反转层在正向传播中不进行数值变换,而在反向传播时自动反转梯度方向。
[0009]进一步的技术方案在于,通用方式旨在利用来自多个数据集的信息来学习一个统一模型,用以提高模型在每个数据集上的表现;在训练阶段,前向传播每个数据集的批次,反向传播显著性预测损失和数据集分类损失,在检测阶段,根据输入数据集的标签来选择相应的数据集特定单元分支,而不使用数据集对抗模块。
[0010]进一步的技术方案在于,领域自适应方式旨在提高在无标签目标域上的性能;在训练阶段,前向传播来自每个源域数据集和一个无标签目标域的批次,对于每个源域数据集需要计算和反向传播显著性预测损失和数据集分类损失,对于目标域则只计算和反向传播数据集分类损失;在测试阶段,对于源域数据集,根据所属数据集的标签来选择相应的数据集特定单元分支,而不使用数据集对抗模块,而对于目标域数据,选择数据量最多的源域数据集作为其数据集标签以确定对应特定单元分支。
[0011]进一步的技术方案在于,领域泛化方式旨在尝试从多个源域数据集中学习泛化模型,而不使用目标域数据;由于目标域的缺失,其训练阶段与通用方式相同,而测试阶段与领域自适应方式相同。
[0012]进一步的技术方案在于,复合批次训练机制用于促进训练过程协同优化,避免不同数据集切换带来的批次抖动;该机制按照多个源域数据集的视频数量比例,将来自每个数据集的批次构建为复合批次;在前向传播时分别计算每个数据集批次的损失,当来自所有数据集批次的损失都计算完后再进行反向传播以更新梯度。
[0013]采用上述技术方案所产生的有益效果在于:该方案突破了传统单数据集或微调训练方式的束缚,提出了视频显著性区域检测的多数据集协作学习范式。利用多个数据集的信息来构建统一模型,不仅提高了显著性区域检测精度,还显著提升了模型针对域外数据的泛化能力,更加适合应用在现实场景中。
附图说明
[0014]下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0015]图1是本专利技术实施例一中基于多数据集协作学习的视频显著性区域检测方法的流
程示意图;图2是本专利技术实施例一中基于多数据集协作学习的视频显著性区域检测方法的整体结构图;图3是本专利技术实施例一中基于多数据集协作学习的视频显著性区域检测方法的网络细节示意图;图4中的(a) 是本专利技术实施例一中空间注意力引导融合模块的结构示意图;(b)是通道注意力引导融合模块的结构示意图;图5是本专利技术实施例一中数据集特定单元的结构示意图;图6是本专利技术实施例一中复合批次训练方式的流程示意图。
具体实施方式
[0016]下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0017]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是本专利技术还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广,因此本专利技术不受下面公开的具体实施例的限制。
[0018]实施例一本专利技术实施例提供了一种基于多数据集协作学习的视频显著性区域检测方法,其流程示意图如图1所示,包括: S1:获取多个带有标签的视频显著性数据集,其中,多个数据集的样本和标签分布不同; S2:构建多数据集协作网络,利用多数据集的信息来获取输入视频的显著图。该网络由3D卷积主干网络的编码器,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多数据集协作学习的视频显著性区域检测方法,其特征在于,包括如下步骤:S1:获取多个带有标签的视频显著性数据集,其中,多个数据集的样本和标签分布不同;S2:构建多数据集协作网络,利用多数据集的信息来获取输入视频的显著图;该网络由3D卷积主干网络的编码器,特征融合模块,数据集特定单元,数据集对抗模块和解码器组成;其中,数据集特定单元包含数据集特定批归一化操作,数据集特定高斯先验图和数据集特定高斯光滑滤波器,用以建模每个数据集的统计特性;数据集对抗模块用以判断输入样本的数据集标签,产生分类损失,以对抗学习的形式促使网络学习具备显著性特征的共性;数据集特定单元和数据集对抗模块协同工作,可以建模多个数据集的统计特性与显著共性,共同来缓解多个数据集之间的分布差异问题;S3:针对域内场景,采用通用方式进行训练和测试;针对未给标签的目标域,采用领域自适应方式进行训练和测试;针对未知目标域,采用领域泛化方式进行训练和测试;并采用复合批次训练机制来辅助多数据集协作网络训练。2.如权利要求1所述的基于多数据集协作学习的视频显著性区域检测方法,其特征在于,所述的数据集特定单元为每个数据集设置了相应的分支,根据输入数据集的标签,自动切换开关以激活相应的分支,从而建模数据集专属特征;其具体应用分为数据集特定批归一化操作,数据集特定高斯先验图和数据集特定高斯光滑滤波器;针对跨数据集的批归一化参数分布不同,数据集特定批归一化操作为通过训练来学习每个数据集的批归一化均值与方差;针对数据集之间的高斯先验图不同,数据集特定高斯先验图为每个数据集构建不同的二维高斯先验图,用以建模每个数据集的中心注视偏差;针对数据集之间的显著图清晰度不同,采用可学习的数据集特定高斯光滑滤波器来消除此偏差。3.如权利要求1所述的基于多数据集协作学习的视频显著性区域检测方法,其特征在于,所述的数据集对抗模块是由梯度反转层和数据集分类器...

【专利技术属性】
技术研发人员:张云佐张天郑宇鑫武存宇刘亚猛于璞泽康伟丽朱鹏飞王双双
申请(专利权)人:石家庄铁道大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1