基于片段特征传播的弱监督时序行为定位方法及系统技术方案

技术编号：39873637 阅读：9 留言：0更新日期：2023-12-30 12:59

本发明专利技术提出基于片段特征传播的弱监督时序行为定位方法及系统，涉及计算机视觉技术领域

全部详细技术资料下载

【技术实现步骤摘要】
基于片段特征传播的弱监督时序行为定位方法及系统

[0001]本专利技术属于计算机视觉
，尤其涉及基于片段特征传播的弱监督时序行为定位方法及系统
。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术
。
[0003]随着计算机技术的蓬勃发展，互联网视频快速生成和传播，相较于之前的纯文字和图片等表现形式，视频的内容更加丰富多样吸引眼球，已经成为一种信息传播和表达的重要载体
。
在这种时代背景下，迫切地需要寻求一种工具对海量视频进行分类
、
识别和检测等，因此视频内容理解算法应运而生
。
时序行为定位作为视频内容理解领域的一个子任务，能够对未剪辑的长视频进行分析，预测出视频中行为的起止时间，并判断其行为类别，应用场景更为广泛，为视频分析技术实现智能自动化提供了重要的支持和推动作用
。
[0004]目前，深度学习技术在图像处理方面的成功运用为该任务提供了解决思路，现阶段的时序行为定位模型主要有全监督和弱监督两种学习方式，两者的区别在于，前者是以帧级的行为实例注解为标签进行训练，后者则以视频级的粗粒度标签进行训练
。
相比之下，全监督的模型需要提供精确的时序边界标注信息，且考虑到标注人员的主观性，需要耗费大量的标注成本和精力，因此弱监督时序行为定位由于其标签的易获取性和标注客观性，获得了广泛地关注
。
[0005]由于现实生活中产生的视频较长，且背景和动作...

【技术保护点】

【技术特征摘要】
1.
基于片段特征传播的弱监督时序行为定位方法，其特征在于，包括以下步骤：获取待处理视频，将待处理视频划分为多个视频片段，分别提取视频片段特征输入至待训练的检测器中；采用期望最大化注意力获取每个视频片段的代表性片段，得到段内视频特征；采用自注意力机制对多个视频片段之间的关系进行建模，得到段间视频特征；将每个段内视频特征和段间视频特征在多个视频片段之间进行迭代传播，得到更新后的段内视频特征和段间视频特征；构造伪标签，基于更新后的段间视频特征得到不确定性分数
、
时间类激活序列和前景
‑
背景注意力，利用不确定性分数加权伪标签损失，指导待训练的检测器从伪标签中学习，得到最终训练好的检测器；基于最终训练好的检测器，获得注意力加权的视频级动作概率，实现对待处理视频中动作的检测
。2.
如权利要求1所述的基于片段特征传播的弱监督时序行为定位方法，其特征在于，所述提取视频片段特征，具体包括：获取每一个视频片段的嵌入特征；对嵌入特征进行背景过滤和动态采样，得到视频片段特征
。3.
如权利要求2所述的基于片段特征传播的弱监督时序行为定位方法，其特征在于：对嵌入特征进行背景过滤和动态采样，具体为：将嵌入特征经由两个卷积层和
sigmoid
函数，输出前景权重；将前景权重乘以嵌入特征，抑制背景帧
、
对背景进行过滤；获取视频片段中行为动作的估计持续时间，更新采样权重，计算更新后采样权重的累积分布函数，利用累积分布函数的逆函数均匀采样，扩大短时动作片段，得到视频片段特征
。4.
如权利要求1所述的基于片段特征传播的弱监督时序行为定位方法，其特征在于，所述期望最大化注意力使用基于高斯混合模型的期望最大化算法，采用分离的高斯混合模型获取每个视频片段的段内视频特征
。5.
如权利要求1所述的基于片段特征传播的弱监督时序行为定位方法，其特征在于，段内视频特征和段间视频特征在多个视频片段之间进行迭代传播，具体公式为：内视频特征和段间视频特征在多个视频片段之间进行迭代传播，具体公式为：
Z
*(t)
＝
softmax(
λ
Norm2(X
fs
)Norm2(
μ
(t
‑
1)
)
T
)
其中，
t
表示第
t
次迭代；
μ
*(0)
为初始的段内视频特征；
ω
表示控制特征传播与原始特征之间权衡的参数；
X
fs
为当前视频的片段特征；
μ
*(t)
为第
t
次迭代的段内视频特征；为第
t
次迭代的段间视频特征；为第
t
‑1次迭代的段间视频特征；
Z
*(t)
为第
t
次迭代时，计算出来的高斯函数的新权重；
Norm1(Z
*
)
T
为
(Z
*(t)
)
T
的逐列
l1归一化；
λ
表示控制分布平滑度的超参数
。6.
如权利要求1所...

【专利技术属性】
技术研发人员：常发亮，马瑞一，刘春生，王德鑫，郇恒强，王彬，常致富，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人