视频识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：41809059 阅读：23 留言：0更新日期：2024-06-24 20:28

本申请涉及一种视频识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取待识别视频和对应的视频动作类别提示文本；基于待识别视频进行视频语义特征提取，得到视频语义特征；将视频动作类别提示文本进行特征转换，得到文本嵌入特征，并使用视频语义特征对文本嵌入特征进行特征增强，得到文本增强特征，基于文本增强特征进行语义特征提取，得到文本语义特征；基于视频语义特征和文本语义特征进行多模态交互，得到目标文本语义特征和目标视频语义特征；基于目标视频语义特征和目标文本语义特征进行相似匹配待识别视频对应的目标视频动作类别。采用本方法能够提高视频动作识别准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像处理，特别是涉及一种视频识别方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

1、随着图像处理技术的发展，出现了视频识别技术，通过视频识别技术可以对视频中对象的动作进行识别，比如，可以识别视频中人走路、跑步、跳跃等的动作，也可以识别视频中动物的动作等。目前，在对视频中的动作进行识别时，通常是使用训练好的人工智能模型对视频中的动作进行识别，能够保证准确地识别出训练过的视频动作。然而，使用训练好的人工智能模型对视频中的未训练过的动作进行识别时，存在无法准确识别的问题。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高视频动作识别准确性的视频识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本申请提供了一种视频识别方法。所述方法包括：

3、获取待识别视频和对应的视频动作类别提示文本；

4、基于待识别视频进行视频语义特征提取，得到视频语义特征；

5、将视频动作类别提示文本进行特...

【技术保护点】

1.一种视频识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述待识别视频进行视频语义特征提取，得到视频语义特征，包括：

3.根据权利要求1所述的方法，其特征在于，所述使用所述视频语义特征对所述文本嵌入特征进行特征增强，得到文本增强特征，包括：

4.根据权利要求1所述的方法，其特征在于，所述使用所述视频语义特征对所述文本语义特征进行多模态交互，得到目标文本语义特征，包括：

5.根据权利要求1所述的方法，其特征在于，所述使用所述文本语义特征对所述视频语义特征进行多模态交互，得到目标视频语义特征，包括：<...

【技术特征摘要】

1.一种视频识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述待识别视频进行视频语义特征提取，得到视频语义特征，包括：

3.根据权利要求1所述的方法，其特征在于，所述使用所述视频语义特征对所述文本嵌入特征进行特征增强，得到文本增强特征，包括：

4.根据权利要求1所述的方法，其特征在于，所述使用所述视频语义特征对所述文本语义特征进行多模态交互，得到目标文本语义特征，包括：

5.根据权利要求1所述的方法，其特征在于，所述使用所述文本语义特征对所述视频语义特征进行多模态交互，得到目标视频语义特征，包括：

6.根据权利要求1所述的方法，其特征在于，所述基于所述目标视频语义特征和所述目标文本语义特征进行相似匹配，得到相似程度，基于所述相似程度和所述视频动作类别提示文本确定所述待识别视频对应的目标视频动作类别，包括：

7.根据权利要求1所述的方法，其特征在于，所述视频动作类别提示文本包括至少两个；所述方法还包括：

8.根据权利要求1...

【专利技术属性】
技术研发人员：王强，杜俊珑，鄢科，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人