基于注意力机制的视频类别预测方法及相关设备技术

技术编号：44162811 阅读：28 留言：0更新日期：2025-01-29 10:34

本申请实施例提供了一种基于注意力机制的视频类别预测方法及相关设备，属于人工智能技术领域。该方法包括：对待预测视频的目标图像数据进行特征提取，得到目标图像特征和目标全局特征。分别通过特征映射层和局部注意力网络对目标图像进行处理，得到目标局部特征。通过特征融合层对局部和全局的特征进行融合，得到目标复合特征。获取每一目标图像数据的目标复合特征，得到多个目标复合特征，通过时序池化模块对多个目标复合特征进行时序特征学习，得到复合时序特征。根据复合时序特征对目标图像数据进行类别预测，得到预测目标类别。准确的提取出目标局部特征后，再基于复合时序特征进行预测，提高了视频类别预测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种基于注意力机制的视频类别预测方法及相关设备。

技术介绍

1、视频是现代社会中广泛使用的媒体形式,包含了大量有价值的信息。然而,由于这些媒体形式具有高度交互性和动态性,理解和识别这些信息变得尤为重要。对于图像分析、人机交互和自动驾驶等领域具有重要意义。图像分析领域可以是对视频进行分类，从而提升视频的审核、推荐和搜索等效果。

2、通过预测视频类别来实现对视频进行分类，视频类别预测为对视频图像的类别进行预测。相关技术中，对图像进行类别预测可以通过人工编写的规则来识别提取局部特征，基于局部特征预测视频类别。但是，受到规则编写的限制和错误的影响，特征提取的准确性较低，从而使图像类别预测的准确性低，进而使视频类别预测的准确性较低。因此，如何提高视频类别预测的准确性，成为了亟待解决的技术问题。

技术实现思路

1、本申请实施例的主要目的在于提出一种基于注意力机制的视频类别预测方法及相关设备，旨在提高视频类别预测的准确性。

2、为实现上述目的，本申请实...

【技术保护点】

1.一种基于注意力机制的视频类别预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述局部注意力网络包括学习注意力层和加权求和层，所述通过所述局部注意力网络对每一所述目标映射特征进行局部注意力处理，得到每一目标局部特征，包括：

3.根据权利要求1所述的方法，其特征在于，所述目标类别预测模型还包括简单循环单元，所述根据所述复合时序特征对所述目标图像数据进行类别预测，得到预测目标类别，包括：

4.根据权利要求3所述的方法，其特征在于，所述目标类别预测模型还包括正则化层，所述根据所述复合时序特征对所述目标图像数据进行类别预测，得...

【技术特征摘要】

1.一种基于注意力机制的视频类别预测方法，其特征在于，所述方法包括：

4.根据权利要求3所述的方法，其特征在于，所述目标类别预测模型还包括正则化层，所述根据所述复合时序特征对所述目标图像数据进行类别预测，得到预测目标类别还包括：

5.根据权利要求1所述的方法，其特征在于，所述时序池化模块包括帧池化层和关系推理层，所述通过所述时序池化模块对多个所述目标复合特征进行时序特征学习，得到复合...

【专利技术属性】
技术研发人员：张兴，王伟，章晓炜，肖立，熊永平，姚敏森，林涛，吴柯维，夏修理，何晓罡，
申请(专利权)人：华润数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人