当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于高效率注意力机制的视频检索特征提取方法技术

技术编号:46426851 阅读:7 留言:0更新日期:2025-09-19 20:34
本发明专利技术公开了一种基于高效率注意力机制的视频检索特征提取方法,属于计算机视觉领域。包括如下步骤:构建基于高效率注意力机制的带有语义感知的特征网络;获取图像训练样本和文本图像对的训练样本;利用基于图像数据随机增强的自监督学习方法预训练得到图像特征编码器;利用基于图像文本对的跨模态语义的自监督学习方法预训练到图像语义特征编码器;对两个编码器进一步联合训练,得到最终的用于短视频检索的视频特征提取网络,将待查询视频抽帧并将视频帧输入视频特征提取网络,即可提取视频图像的特征。本发明专利技术可以在大幅度提高短视频检索工作的视频特征提取效率的前提下,保证特征网络兼顾视频画面的浅层细节特征和时间语义特征,提高检索的最终性能。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,尤其涉及一种基于高效率注意力机制的视频检索特征提取方法,可以将其应用于短视频检索的场景中。


技术介绍

1、随着视频数据不断增长,有效地组织、查找和分析视频内容变得愈发具有挑战性。在这种情况下,视频检索技术应运而生。视频检索是一种涉及从大量视频数据中提取、匹配和检索相关信息的技术方法,它的发展受益于计算机视觉、机器学习和人工智能的快速进步。通过分析视频中的视觉和语义信息,视频检索系统可以自动识别对象、场景、动作以及其他关键元素,从而使用户能够更轻松地搜索和访问所需内容。

2、然而,视频数据的复杂性、大规模性和多样性使得精确的检索变得困难。同时,跨语言、跨文化以及多模态的内容也增加了技术的复杂性。视频检索主要涉及到抽帧、特征提取、匹配排序等环节,当前研究重点主要集中在特征提取工作。一种方法是将视频按照视频级别提取特征,另外一种做法是按照帧级别提取特征;视频级别的特征向量形式可以直接用于相似性计算,完成检索排序;帧级别的特征向量形式需要经过匹配聚合的操作,再来计算相似度关系完成排序。

3、在研究方面,之前的帧本文档来自技高网...

【技术保护点】

1.一种基于高效率注意力机制的视频检索特征提取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于高效率注意力机制的视频检索特征提取方法,其特征在于,所述基于高效率注意力机制的带有语义感知的特征网络包括图像预处理模块、高效率注意力机制模块和融合输出模块;

3.根据权利要求1所述的基于高效率注意力机制的视频检索特征提取方法,其特征在于,所述采用部分图像训练样本训练所述特征网络,具体包括:

4.根据权利要求1所述的基于高效率注意力机制的短视频检索的特征提取方法,其特征在于,所述预训练的文本编码器为Sentence-BERT库中的预训练模型M3E-...

【技术特征摘要】

1.一种基于高效率注意力机制的视频检索特征提取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于高效率注意力机制的视频检索特征提取方法,其特征在于,所述基于高效率注意力机制的带有语义感知的特征网络包括图像预处理模块、高效率注意力机制模块和融合输出模块;

3.根据权利要求1所述的基于高效率注意力机制的视频检索特征提取方法,其特征在于,所述采用部分图像训练样本训练所述特征网络,具体包括:

4.根据权利要求1所述的基于高效率注意力机制的短视频检索的特征提取方法,其特征在于,所述预训练的文本编码器为sentence-bert库中的预训练模型m3e-base。

5.根据权利要求1所述的一种基于高效率注意...

【专利技术属性】
技术研发人员:丁勇胡亚坤余庆刘琳琳牛乐乐何乐年
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1