用于识别视频的方法及装置制造方法及图纸

技术编号：25522936 阅读：17 留言：0更新日期：2020-09-04 17:12

本公开的实施例公开了用于识别视频的方法及装置。该方法的一具体实施方式包括：从待识别视频中获取设定个视频帧，得到视频帧序列；执行如下处理步骤：将上述视频帧序列导入预先训练的视频识别模型，得到对应上述视频帧序列的分类标签概率，上述分类标签概率用于表征识别上述待识别视频属于对应标签类别的概率；响应于上述分类标签概率大于等于预设的识别准确率阈值，根据上述分类标签概率为上述待识别视频设置视频标签，否则，增加上述视频帧序列内视频帧的数量，继续执行上述处理步骤。该实施方式可以以尽量少的视频帧实现对待识别视频的识别，有利于减少识别视频过程的数据处理量，提高识别视频的效率。

全部详细技术资料下载

【技术实现步骤摘要】
用于识别视频的方法及装置
本公开的实施例涉及计算机
，具体涉及用于识别视频的方法及装置。
技术介绍
随着智能设备的大量使用和网络技术的进步，各种类型的视频(例如可以是足球视频、篮球视频、网球视频等)在网络上广泛传播。为了向用户提供准确的视频信息，技术人员需要获取各种视频的内容，进而为视频设置对应的视频标签。视频理解的最主要的一个问题是识别视频里面的内容。视频是由一个图片序列组成，对视频进行分类需要大量的图片帧进行计算，进而确定视频内容类别。
技术实现思路
本公开的实施例提出了用于识别视频的方法及装置。第一方面，本公开的实施例提供了一种用于识别视频的方法，该方法包括：从待识别视频中获取设定个视频帧，得到视频帧序列；执行如下处理步骤：将上述视频帧序列导入预先训练的视频识别模型，得到对应上述视频帧序列的分类标签概率，上述分类标签概率用于表征识别上述待识别视频属于对应标签类别的概率；响应于上述分类标签概率大于等于预设的识别准确率阈值，根据上述分类标签概率为上述待识别视频设置视频标签，否则，增加上述视频帧序列内视频帧的数量，继续执行上述处理步骤，其中，上述视频标签用于标识上述待识别视频的内容类别。在一些实施例中，上述将上述视频帧序列导入预先训练的视频识别模型，得到对应上述视频帧序列的分类标签概率，包括：根据上述视频帧序列内视频帧的数量确定网络层组，其中，上述网络层组包含设定数量的网络层，上述网络层用于对视频帧进行特征提取；通过上述网络层组对上述视频帧序列中的每个视频帧进行特征提...

【技术保护点】
1.一种用于识别视频的方法，包括：/n从待识别视频中获取设定个视频帧，得到视频帧序列；/n执行如下处理步骤：将所述视频帧序列导入预先训练的视频识别模型，得到对应所述视频帧序列的分类标签概率，所述分类标签概率用于表征识别所述待识别视频属于对应标签类别的概率；/n响应于所述分类标签概率大于等于预设的识别准确率阈值，根据所述分类标签概率为所述待识别视频设置视频标签，否则，增加所述视频帧序列内视频帧的数量，继续执行所述处理步骤，其中，所述视频标签用于标识所述待识别视频的内容类别。/n

【技术特征摘要】
1.一种用于识别视频的方法，包括：
从待识别视频中获取设定个视频帧，得到视频帧序列；
执行如下处理步骤：将所述视频帧序列导入预先训练的视频识别模型，得到对应所述视频帧序列的分类标签概率，所述分类标签概率用于表征识别所述待识别视频属于对应标签类别的概率；
响应于所述分类标签概率大于等于预设的识别准确率阈值，根据所述分类标签概率为所述待识别视频设置视频标签，否则，增加所述视频帧序列内视频帧的数量，继续执行所述处理步骤，其中，所述视频标签用于标识所述待识别视频的内容类别。

2.根据权利要求1所述的方法，其中，所述将所述视频帧序列导入预先训练的视频识别模型，得到对应所述视频帧序列的分类标签概率，包括：
根据所述视频帧序列内视频帧的数量确定网络层组，其中，所述网络层组包含设定数量的网络层，所述网络层用于对视频帧进行特征提取；
通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取，得到对应所述视频帧序列的分类标签概率。

3.根据权利要求2所述的方法，其中，所述通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取，得到对应所述视频帧序列的分类标签概率，包括：
通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取，得到至少一个初始目标物体图像信息；
对于所述至少一个初始目标物体图像信息中的初始目标物体图像信息，将该初始目标物体图像信息与标签集合匹配，确定该初始目标物体图像信息的初始识别准确率，所述初始识别准确率包括初始目标物体图像信息属于标签集合中每个标签的概率；
将所述至少一个初始目标物体图像信息对应的至少一个初始识别准确率中的、取值大于设定阈值的初始识别准确率设置为所述视频帧序列的分类标签概率，其中，所述分类标签概率与最终目标物体图像。

4.根据权利要求3所述的方法，其中，所述通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取，得到至少一个初始目标物体图像信息，包括：
对所述视频帧序列中每个视频帧包含的物体图像进行识别，得到至少一个初始物体图像信息；
查询所述至少一个初始物体图像信息对应的物体图像在所述视频帧序列中的出现次数，并确定所述至少一个初始物体图像信息对应的物体图像在每个视频帧中的位置信息；
根据所述出现次数和位置信息确定至少一个初始目标物体图像信息。

5.根据权利要求3所述的方法，其中，所述根据所述分类标签概率为所述待识别视频设置视频标签，包括：
响应于所述最终目标物体图像信息为一个，将所述最终目标物体图像信息对应的目标标签设置为视频标签。

6.根据权利要求3所述的方法，其中，所述根据所述分类标签概率为所述待识别视频设置视频标签，包括：
响应于所述最终目标物体图像信息为多个，查询多个最终目标物体图像信息对应的目标物体图像在所述待识别视频中出现的先后顺序信息，根据所述先后顺序信息和最终目标物体图像信息对应的目标标签设置视频标签。

7.一种用于识别视频的装置，包括：
视频帧序列获取单元，被配置成从待识别视频中获取设定个视频帧，得到视频帧序列；
分类标签概率计算单元，被配置成执行如下处理步骤：将所述视频帧序列导入预先训练的视频识别模型，得到对应所述视频帧...

【专利技术属性】
技术研发人员：何栋梁，谭啸，文石磊，孙昊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人