【技术实现步骤摘要】
一种基于时间序列特征的伪标签生成视频显著性检测方法
[0001]本专利技术涉及计算机视觉的
,尤其涉及一种基于时间序列特征的伪标签生成视频显著性检测方法
。
技术介绍
[0002]视频显著性检测是计算机视觉领域的一个重要研究方向,旨在自动地识别视频中最具有吸引力的区域,为视频分析
、
编辑和压缩等应用提供基础性支持
。
视频显著性检测已经广泛应用于视频广告
、
视频监控
、
视频摄像等领域
。
视频显著性检测是针对视频中最具吸引力区域
(
如运动物体
、
场景变化
、
光照变化等
)
进行识别和分析的技术,可以帮助计算机自动识别视频中最具吸引力的区域,从而提高视频分析
、
编辑
、
压缩等应用的效率和准确性
。
以下是一些比较重要的视频显著性检测技术:
(1)
基于深度学习的视频显著性检测:深度学习技术已经成为视频显著性检测的主流方法
。
其中,基于卷积神经网络
(CNN)
的方法是目前最常用的方法之一
。
通过使用
CNN
等深度学习模型,可以自动地学习视频中最具有吸引力的区域的特征,并进行显著性检测
。(2)
基于时空注意力机制的视频显著性检测:时空注意力机制是一种可以对视频中物体的运动和场景变化进行建模的方法,该方 ...
【技术保护点】
【技术特征摘要】
1.
一种基于时间序列特征的伪标签生成视频显著性检测方法,其特征在于,其步骤如下:
S1
:将数据集中的视频序列输入到
LSTM
模型中进行编码和解码,提取视频序列的时间序列特征;
S2
:基于时间序列特征的伪标签生成算法根据视频序列中相邻帧之间的相似度生成伪标签,将生成的伪标签和真实标签放在一起作为一个训练数据集训练
LSTM
模型;
S3
:利用置信度感知显著性提取方案根据样本的置信度和训练进度对带有噪声标签的样本进行评分,选择置信度高的样本训练
LSTM
模型;
S4
:采用一种评分机制来引导
LSTM
模型逐步从简单到困难地提取显著性知识;
S5
:用伪标签和数据集中每一帧标注的图像组成新训练数据集,利用新训练数据集反复训练
LSTM
模型,得到显著性检测模型;
S6
:将待检测的新训练数据集输入到显著性检测模型中,得到新训练数据集中每一帧图像的显著性检测结果,得到待检测视频序列的显著图
。2.
根据权利要求1所述的基于时间序列特征的伪标签生成视频显著性检测方法,其特征在于,将每个视频序列中的每一帧图像输入到一个预训练的卷积神经网络中,卷积神经网络将每一帧图像转换为具有固定维度的特征向量,得到每一帧图像的特征表示;将每一帧图像特征表示输入到
LSTM
模型中,提取时间序列特征
。3.
根据权利要求2所述的基于时间序列特征的伪标签生成视频显著性检测方法,其特征在于,所述数据集为
DAVIS
数据集,
DAVIS
数据集的每个视频序列提供了像素级别的注释,包括前景目标分割和边界框注释;在训练时,使用随机裁剪
、
水平翻转和调整亮度的数据增强技术来处理
DAVIS
数据集的视频序列;所述卷积神经网络是经典的
ResNet
网络,使用
DAVIS
数据集进行预训练,使用预训练的权重初始化
ResNet
网络,通过反向传播和梯度下降算法微调
ResNet
网络参数
。4.
根据权利要求1‑3中任意一项所述的基于时间序列特征的伪标签生成视频显著性检测方法,其特征在于,所述
LSTM
模型包括依次连接的输入层
、
编码器
、
解码器和输出层,输入层接收输入的视频序列,编码器对视频序列进行编码和提取时间序列特征,解码器使用全连接层将编码器的时间序列特征映射到所需的输出空间,输出层输出时间序列的特征向量
。5.
根据权利要求4所述的基于时间序列特征的伪标签生成视频显著性检测方法,其特征在于,所述编码器包括依次连接的多个
LSTM
层和
Bi
‑
LSTM
层,
LSTM
层通过学习时间依赖关系捕捉视频序列的短期依赖关系;
Bi
‑
LSTM
层则通过同时处理正向和反向的视频序列,捕捉更全面的上下文信息
。6.
根据权利要求5所述的基于时间序列特征的伪标签生成视频显著性检测方法,其特征在于,所述编码器包括依次连接的第一
LSTM
层
、
第二
LSTM
层
、Bi
‑
LSTM
层
、
第三
LSTM
层和第四
LSTM
层,第一
LSTM
层接收输入的视频序列并学习其时间依赖关系,捕捉视频序列的短期依赖关系,并传递给下一层;第二
LSTM
层进一步学习输入的视频序列的...
【专利技术属性】
技术研发人员:徐涛,史肖丽,蔡磊,柴豪杰,赵未硕,蒋靓峣,
申请(专利权)人:河南科技学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。