基于特征表达增强的视频摘要生成方法及系统技术方案

技术编号：45052166 阅读：34 留言：0更新日期：2025-04-22 17:36

本发明专利技术公开了一种基于特征表达增强的视频摘要生成方法及系统，涉及计算机视觉技术领域，包括：获取原始视频并提取视频帧图像序列；将视频帧图像序列输入至OCVF视频理解模型中，输入的每一视频帧图像先经特征提取模块提取初始特征，初始特征经注意力模块提取关键时空特征，再经特征映射和跳跃连接生成高层次特征表示，高层次特征表示再通过分类器输出每一视频帧的重要性分数，确定关键帧，生成最终的视频摘要结果；其中，注意力模块包括依次设置的通道注意力层、平均池化层、位置编码层、自注意力层和时空注意力层。本发明专利技术可实现对视频内容更综合的建模和高效理解，实现更鲁棒、更精确的视频摘要生成。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉，尤其涉及一种基于特征表达增强的视频摘要生成方法及系统。

技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。

2、视频摘要是自然语言处理(nlp)领域的一项重要任务，也是目前的研究热点。随着短视频平台的快速发展，视频数据呈现爆炸性增长，如何高效地理解和提取视频中的关键信息，进而生成简洁而准确的视频摘要是当前亟待解决的核心问题之一。视频摘要是指通过提取视频中的关键信息，将长视频压缩为简短且易于理解的形式，以便用户快速获取视频核心内容。

3、目前，视频摘要主要在于对关键信息的提取，特别是通过关键帧来提取概括视频的核心内容，但是，往往这种方法存在诸多不足之处，例如：现有研究通常是通过分析视频帧的关键特征以压缩视频信息并保留重要元素，但提取视频帧的特征往往不够具有代表性。随着神经网络的发展，考虑到cnn(convolutional neural networks, 卷积神经网络)强大的特征提取能力，当前常利用cnn对视频帧的特征提取进行深入分析与理解，以此提...

【技术保护点】

1.一种基于特征表达增强的视频摘要生成方法，其特征在于，包括：

2.如权利要求1所述的一种基于特征表达增强的视频摘要生成方法，其特征在于，所述通道注意力层中，输入的初始特征图经全局平均池化对空间信息进行压缩，得到每个通道的全局描述，再通过卷积学习通道注意力信息，利用激活函数得到每个通道的注意力权重；

3.如权利要求1所述的一种基于特征表达增强的视频摘要生成方法，其特征在于，所述位置编码层中，针对输入的每一视频帧图像的特征表示，引入当前视频帧在原始视频中的位置信息，得到位置编码后的特征表示；

4.如权利要求1所述的一种基于特征表达增强的视频摘要生成方法，...

【技术特征摘要】

1.一种基于特征表达增强的视频摘要生成方法，其特征在于，包括：

4.如权利要求1所述的一种基于特征表达增强的视频摘要生成方法，其特征在于，经位置编码后的特征依次通过自注意力层和时空注意力层提取关键时空特...

【专利技术属性】
技术研发人员：朱振方，付振睿，裴洪丽，卢强，王富瑞，柴建勇，赵大伟，亓江涛，李克峰，刘芸，陈竹敏，
申请(专利权)人：山东交通学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人