基于多数据集协作学习的视频显著性区域检测方法技术

技术编号：37417174 阅读：7 留言：0更新日期：2023-04-30 09:40

本发明专利技术公开了一种基于多数据集协作学习的视频显著性区域检测方法。所述方法包括如下步骤：获取多个分布不同的视频显著性数据集；构建多数据集协作网络，通过数据集特定单元以建模多数据集的统计特性，通过数据集对抗模块以促使网络学习具备显著性特征的共性，二者联合来缓解数据集之间分布差异问题；针对不同的应用场景，提出相对应的多数据集训练和测试方式，并采用复合批次训练机制以优化协作学习过程。所述方法区别于常见的单数据集或微调训练模式，利用多个数据集的信息来提升视频显著性区域检测精度，并提高模型在域外数据上的泛化表现。表现。表现。

全部详细技术资料下载

【技术实现步骤摘要】
基于多数据集协作学习的视频显著性区域检测方法

[0001]本专利技术涉及图像通信方法
，尤其涉及一种基于多数据集协作学习的视频显著性区域检测方法。

技术介绍

[0002]视频显著性区域检测是视频处理和计算机视觉中的基本任务之一，也是感知视频编码中重要的预处理任务。它旨在模拟人类视觉注意系统，预测人类自由观看视频时对各个视频区域的关注程度，以显著性图的形式表达出来。在感知视频编码中，首先进行视频显著性区域的捕获，然后把比特资源更多的分配给显著性区域，使得显著性区域保持高清，而非显著性区域适当失真，以达到在主观视觉感知不变的情况下降低视频码率，提升视频压缩率，进而缩减视频存储空间，减轻视频通信的带宽负担。
[0003]随着深度学习的发展，视频显著性区域检测领域取得很大的进步，但是大多数的视频显著性检测模型都是以单数据集或微调方式进行训练的。由于单个数据集的数据量有限，其检测精度趋近饱和，且缺乏足够的泛化能力，阻碍了这些模型在现实生活中的应用。利用多个数据集进行训练扩充了训练数据量，看似可以解决以上问题，但是数据集之间常常存在分布偏差，直接在多数据集上训练得到的模型常常还不如单数据集或者微调模型下的结果。由此可见，如何解耦数据集间的分布差异，建模具有显著信息的共性特征是有效进行多数据集训练的关键。

技术实现思路

[0004][0005]本专利技术为了解决现有方法中的上述问题，提出一种基于多数据集协作学习的视频显著性区域检测方法。
[0006]一种基于多数据集协作学习的视频显著性区域检测...

【技术保护点】

【技术特征摘要】
1.一种基于多数据集协作学习的视频显著性区域检测方法，其特征在于，包括如下步骤：S1：获取多个带有标签的视频显著性数据集，其中，多个数据集的样本和标签分布不同；S2：构建多数据集协作网络，利用多数据集的信息来获取输入视频的显著图；该网络由3D卷积主干网络的编码器，特征融合模块，数据集特定单元，数据集对抗模块和解码器组成；其中，数据集特定单元包含数据集特定批归一化操作，数据集特定高斯先验图和数据集特定高斯光滑滤波器，用以建模每个数据集的统计特性；数据集对抗模块用以判断输入样本的数据集标签，产生分类损失，以对抗学习的形式促使网络学习具备显著性特征的共性；数据集特定单元和数据集对抗模块协同工作，可以建模多个数据集的统计特性与显著共性，共同来缓解多个数据集之间的分布差异问题；S3：针对域内场景，采用通用方式进行训练和测试；针对未给标签的目标域，采用领域自适应方式进行训练和测试；针对未知目标域，采用领域泛化方式进行训练和测试；并采用复合批次训练机制来辅助多数据集协作网络训练。2.如权利要求1所述的基于多数据集协作学习的视频显著性区域检测方法，其特征在于，所述的数据集特定单元为每个数据集设置了相应的分支，根据输入数据集的标签，自动切换开关以激活相应的分支，从而建模数据集专属特征；其具体应用分为数据集特定批归一化操作，数据集特定高斯先验图和数据集特定高斯光滑滤波器；针对跨数据集的批归一化参数分布不同，数据集特定批归一化操作为通过训练来学习每个数据集的批归一化均值与方差；针对数据集之间的高斯先验图不同，数据集特定高斯先验图为每个数据集构建不同的二维高斯先验图，用以建模每个数据集的中心注视偏差；针对数据集之间的显著图清晰度不同，采用可学习的数据集特定高斯光滑滤波器来消除此偏差。3.如权利要求1所述的基于多数据集协作学习的视频显著性区域检测方法，其特征在于，所述的数据集对抗模块是由梯度反转层和数据集分类器...

【专利技术属性】
技术研发人员：张云佐，张天，郑宇鑫，武存宇，刘亚猛，于璞泽，康伟丽，朱鹏飞，王双双，
申请(专利权)人：石家庄铁道大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人