用于识别视频的方法及装置制造方法及图纸

技术编号:25522936 阅读:17 留言:0更新日期:2020-09-04 17:12
本公开的实施例公开了用于识别视频的方法及装置。该方法的一具体实施方式包括:从待识别视频中获取设定个视频帧,得到视频帧序列;执行如下处理步骤:将上述视频帧序列导入预先训练的视频识别模型,得到对应上述视频帧序列的分类标签概率,上述分类标签概率用于表征识别上述待识别视频属于对应标签类别的概率;响应于上述分类标签概率大于等于预设的识别准确率阈值,根据上述分类标签概率为上述待识别视频设置视频标签,否则,增加上述视频帧序列内视频帧的数量,继续执行上述处理步骤。该实施方式可以以尽量少的视频帧实现对待识别视频的识别,有利于减少识别视频过程的数据处理量,提高识别视频的效率。

【技术实现步骤摘要】
用于识别视频的方法及装置
本公开的实施例涉及计算机
,具体涉及用于识别视频的方法及装置。
技术介绍
随着智能设备的大量使用和网络技术的进步,各种类型的视频(例如可以是足球视频、篮球视频、网球视频等)在网络上广泛传播。为了向用户提供准确的视频信息,技术人员需要获取各种视频的内容,进而为视频设置对应的视频标签。视频理解的最主要的一个问题是识别视频里面的内容。视频是由一个图片序列组成,对视频进行分类需要大量的图片帧进行计算,进而确定视频内容类别。
技术实现思路
本公开的实施例提出了用于识别视频的方法及装置。第一方面,本公开的实施例提供了一种用于识别视频的方法,该方法包括:从待识别视频中获取设定个视频帧,得到视频帧序列;执行如下处理步骤:将上述视频帧序列导入预先训练的视频识别模型,得到对应上述视频帧序列的分类标签概率,上述分类标签概率用于表征识别上述待识别视频属于对应标签类别的概率;响应于上述分类标签概率大于等于预设的识别准确率阈值,根据上述分类标签概率为上述待识别视频设置视频标签,否则,增加上述视频帧序列内视频帧的数量,继续执行上述处理步骤,其中,上述视频标签用于标识上述待识别视频的内容类别。在一些实施例中,上述将上述视频帧序列导入预先训练的视频识别模型,得到对应上述视频帧序列的分类标签概率,包括:根据上述视频帧序列内视频帧的数量确定网络层组,其中,上述网络层组包含设定数量的网络层,上述网络层用于对视频帧进行特征提取;通过上述网络层组对上述视频帧序列中的每个视频帧进行特征提取,得到对应上述视频帧序列的分类标签概率。在一些实施例中,上述通过上述网络层组对上述视频帧序列中的每个视频帧进行特征提取,得到对应上述视频帧序列的分类标签概率,包括:通过上述网络层组对上述视频帧序列中的每个视频帧进行特征提取,得到至少一个初始目标物体图像信息;对于上述至少一个初始目标物体图像信息中的初始目标物体图像信息,将该初始目标物体图像信息与标签集合匹配,确定该初始目标物体图像信息的初始识别准确率,上述初始识别准确率包括初始目标物体图像信息属于标签集合中每个标签的概率;将上述至少一个初始目标物体图像信息对应的至少一个初始识别准确率中的、取值大于设定阈值的初始识别准确率设置为上述视频帧序列的分类标签概率,其中,上述分类标签概率与最终目标物体图像。在一些实施例中,上述通过上述网络层组对上述视频帧序列中的每个视频帧进行特征提取,得到至少一个初始目标物体图像信息,包括:对上述视频帧序列中每个视频帧包含的物体图像进行识别,得到至少一个初始物体图像信息;查询上述至少一个初始物体图像信息对应的物体图像在上述视频帧序列中的出现次数,并确定上述至少一个初始物体图像信息对应的物体图像在每个视频帧中的位置信息;根据上述出现次数和位置信息确定至少一个初始目标物体图像信息。在一些实施例中,上述根据上述分类标签概率为上述待识别视频设置视频标签,包括:响应于上述最终目标物体图像信息为一个,将上述最终目标物体图像信息对应的目标标签设置为视频标签。在一些实施例中,上述根据上述分类标签概率为上述待识别视频设置视频标签,包括:响应于上述最终目标物体图像信息为多个,查询多个最终目标物体图像信息对应的目标物体图像在上述待识别视频中出现的先后顺序信息,根据上述先后顺序信息和最终目标物体图像信息对应的目标标签设置视频标签。第二方面,本公开的实施例提供了一种用于识别视频的装置,该装置包括:视频帧序列获取单元,被配置成从待识别视频中获取设定个视频帧,得到视频帧序列;分类标签概率计算单元,被配置成执行如下处理步骤:将上述视频帧序列导入预先训练的视频识别模型,得到对应上述视频帧序列的分类标签概率,上述分类标签概率用于表征识别上述待识别视频属于对应标签类别的概率;控制单元,响应于上述分类标签概率大于等于预设的识别准确率阈值,被配置成根据上述分类标签概率为上述待识别视频设置视频标签,否则,增加上述视频帧序列内视频帧的数量,继续执行上述处理步骤,其中,上述视频标签用于标识上述待识别视频的内容类别。在一些实施例中,上述分类标签概率计算单元包括:网络层确定子单元,被配置成根据上述视频帧序列内视频帧的数量确定网络层组,其中,上述网络层组包含设定数量的网络层,上述网络层用于对视频帧进行特征提取;分类标签概率计算子单元,被配置成通过上述网络层组对上述视频帧序列中的每个视频帧进行特征提取,得到对应上述视频帧序列的分类标签概率。在一些实施例中,上述分类标签概率计算子单元包括:初始目标物体图像信息获取模块,被配置成通过上述网络层组对上述视频帧序列中的每个视频帧进行特征提取,得到至少一个初始目标物体图像信息;初始识别准确率获取模块,对于上述至少一个初始目标物体图像信息中的初始目标物体图像信息,被配置成将该初始目标物体图像信息与标签集合匹配,确定该初始目标物体图像信息的初始识别准确率,上述初始识别准确率包括初始目标物体图像信息属于标签集合中每个标签的概率;分类标签概率计算模块,被配置成将上述至少一个初始目标物体图像信息对应的至少一个初始识别准确率中的、取值大于设定阈值的初始识别准确率设置为上述视频帧序列的分类标签概率,其中,上述分类标签概率与最终目标物体图像。在一些实施例中,上述初始目标物体图像信息获取模块包括:初始物体图像信息获取子模块,被配置成对上述视频帧序列中每个视频帧包含的物体图像进行识别,得到至少一个初始物体图像信息;信息获取子模块,被配置成查询上述至少一个初始物体图像信息对应的物体图像在上述视频帧序列中的出现次数,并确定上述至少一个初始物体图像信息对应的物体图像在每个视频帧中的位置信息;初始目标物体图像信息获取子模块,被配置成根据上述出现次数和位置信息确定至少一个初始目标物体图像信息。在一些实施例中,上述控制单元包括:第一视频标签设置子单元,响应于上述最终目标物体图像信息为一个,被配置成将上述最终目标物体图像信息对应的目标标签设置为视频标签。在一些实施例中,上述控制单元包括:第二视频标签设置子单元,响应于上述最终目标物体图像信息为多个,被配置成将查询多个最终目标物体图像信息对应的目标物体图像在上述待识别视频中出现的先后顺序信息,根据上述先后顺序信息和最终目标物体图像信息对应的目标标签设置视频标签。第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于识别视频的方法。第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面的用于识别视频的方法。本公开的实施例提供的用于识别视频的方法及装置,首先从待识别视频中获取设定个视频帧,得到视频帧序列;然后将上述视频帧序列导入预先训练的视频识别模型,得到对应上述视频帧序列的分类标签概率,实现了对待识别视频的识别;最后在分类标签概率大于等于预设的识别准确率阈值本文档来自技高网...

【技术保护点】
1.一种用于识别视频的方法,包括:/n从待识别视频中获取设定个视频帧,得到视频帧序列;/n执行如下处理步骤:将所述视频帧序列导入预先训练的视频识别模型,得到对应所述视频帧序列的分类标签概率,所述分类标签概率用于表征识别所述待识别视频属于对应标签类别的概率;/n响应于所述分类标签概率大于等于预设的识别准确率阈值,根据所述分类标签概率为所述待识别视频设置视频标签,否则,增加所述视频帧序列内视频帧的数量,继续执行所述处理步骤,其中,所述视频标签用于标识所述待识别视频的内容类别。/n

【技术特征摘要】
1.一种用于识别视频的方法,包括:
从待识别视频中获取设定个视频帧,得到视频帧序列;
执行如下处理步骤:将所述视频帧序列导入预先训练的视频识别模型,得到对应所述视频帧序列的分类标签概率,所述分类标签概率用于表征识别所述待识别视频属于对应标签类别的概率;
响应于所述分类标签概率大于等于预设的识别准确率阈值,根据所述分类标签概率为所述待识别视频设置视频标签,否则,增加所述视频帧序列内视频帧的数量,继续执行所述处理步骤,其中,所述视频标签用于标识所述待识别视频的内容类别。


2.根据权利要求1所述的方法,其中,所述将所述视频帧序列导入预先训练的视频识别模型,得到对应所述视频帧序列的分类标签概率,包括:
根据所述视频帧序列内视频帧的数量确定网络层组,其中,所述网络层组包含设定数量的网络层,所述网络层用于对视频帧进行特征提取;
通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取,得到对应所述视频帧序列的分类标签概率。


3.根据权利要求2所述的方法,其中,所述通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取,得到对应所述视频帧序列的分类标签概率,包括:
通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取,得到至少一个初始目标物体图像信息;
对于所述至少一个初始目标物体图像信息中的初始目标物体图像信息,将该初始目标物体图像信息与标签集合匹配,确定该初始目标物体图像信息的初始识别准确率,所述初始识别准确率包括初始目标物体图像信息属于标签集合中每个标签的概率;
将所述至少一个初始目标物体图像信息对应的至少一个初始识别准确率中的、取值大于设定阈值的初始识别准确率设置为所述视频帧序列的分类标签概率,其中,所述分类标签概率与最终目标物体图像。


4.根据权利要求3所述的方法,其中,所述通过所述网络层组对所述视频帧序列中的每个视频帧进行特征提取,得到至少一个初始目标物体图像信息,包括:
对所述视频帧序列中每个视频帧包含的物体图像进行识别,得到至少一个初始物体图像信息;
查询所述至少一个初始物体图像信息对应的物体图像在所述视频帧序列中的出现次数,并确定所述至少一个初始物体图像信息对应的物体图像在每个视频帧中的位置信息;
根据所述出现次数和位置信息确定至少一个初始目标物体图像信息。


5.根据权利要求3所述的方法,其中,所述根据所述分类标签概率为所述待识别视频设置视频标签,包括:
响应于所述最终目标物体图像信息为一个,将所述最终目标物体图像信息对应的目标标签设置为视频标签。


6.根据权利要求3所述的方法,其中,所述根据所述分类标签概率为所述待识别视频设置视频标签,包括:
响应于所述最终目标物体图像信息为多个,查询多个最终目标物体图像信息对应的目标物体图像在所述待识别视频中出现的先后顺序信息,根据所述先后顺序信息和最终目标物体图像信息对应的目标标签设置视频标签。


7.一种用于识别视频的装置,包括:
视频帧序列获取单元,被配置成从待识别视频中获取设定个视频帧,得到视频帧序列;
分类标签概率计算单元,被配置成执行如下处理步骤:将所述视频帧序列导入预先训练的视频识别模型,得到对应所述视频帧...

【专利技术属性】
技术研发人员:何栋梁谭啸文石磊孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1