一种识别视频数据中视频场景的方法和装置制造方法及图纸

技术编号:21917697 阅读:26 留言:0更新日期:2019-08-21 13:36
本发明专利技术实施例公开了一种识别视频数据中视频场景的方法和装置。所述方法包括:通过预设的图像识别模型确定目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别的所述视频场景在所述目标视频数据中的权重值;另外,获得用户输入的参数信息,根据所述参数信息和所述权重值的大小从所述视频场景中确定目标视频场景,并将所述目标视频场景返回至客户端。采用本发明专利技术所述的方法,能够通过比较视频场景在目标视频数据中的权重值快速识别目标视频数据对应的目标视频场景,从而提高了目标视频场景的识别效率和精确度。

A Method and Device for Recognizing Video Scene in Video Data

【技术实现步骤摘要】
一种识别视频数据中视频场景的方法和装置
本专利技术实施例涉及视频数据处理
,具体涉及一种识别视频数据中视频场景的方法和装置,另外,还涉及一种电子设备和存储设备。
技术介绍
随着科学技术的快速发展,各种视频资料越来越丰富,一段完整的视频数据往往包含多个视频场景,视频数据的视频场景识别是一个比较常见的问题,但是,要想实现对所述视频数据中视频场景的精准识别却比较困难。因此,如何提高视频场景识别的准确度,降低目标视频的视频场景误识率成为本领域技术人员急需解决的技术问题。为了解决上述技术问题,现有技术中通常采用的视频场景识别办法是提取视频数据中所包含视频帧的图像特征来表征视频数据,然后基于预设的分类器对视频数据的图像特征进行识别和分类,不同的类别对应不同的视频场景,从而实现了对视频数据中视频场景的识别。然而,上述视频场景识别方法容易受到分类器性能的影响,导致对视频场景的分类准确度仍然不高,无法满足当前用户的需求。
技术实现思路
为此,本专利技术实施例提供一种识别视频数据中视频场景的方法和装置,以解决现有技术中存在的由于当前视频场景切分技术不够成熟,导致的目标场景提取不够精确的问题。为了实现上述目的,本专利技术实施例提供如下技术方案:根据本专利技术实施例提供的一种识别视频数据中视频场景的方法,包括:按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据;其中,所述目标视频数据包含至少一个所述视频场景的视频帧;通过预设的图像识别模型,确定所述目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;其中,所述图像识别模型为根据所述目标视频数据包含所述视频场景的特征信息对所述目标视频数据包含的所述视频场景进行分类的深度神经网络模型;将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别的所述视频场景在所述目标视频数据中的权重值;获得用户输入的参数信息,根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,并将所述目标视频场景返回至客户端。进一步的,所述根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,具体包括:从所述参数信息中提取目标参数值;根据所述目标参数值和所述权重值的大小,从所述视频场景中获得所述权重值达到或者超过预设权重阈值的第一视频场景,将所述第一视频场景作为所述目标视频场景;其中,所述第一视频场景包含至少一个所述视频场景。进一步的,所述的视频场景识别方法,还包括:从所述参数信息中提取目标参数值;判断所述目标参数值是否大于所述目标视频数据所包含所述视频场景的种类数量,若是,则向所述客户端返回告警提示信息。进一步的,所述视频帧的置信度是指所述视频帧为所述视频场景对应的视频帧的概率值。进一步的,所述按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据,具体包括:获得待检测的所述完整视频数据;通过特征提取算法获得所述完整视频数据中所述视频场景的颜色特征;通过所述特征提取算法获得所述完整视频数据中所述视频帧的颜色特征;根据所述完整视频数据中相邻两个所述视频场景的第一颜色特征差异和所述完整视频数据中相邻两个视频帧之间的第二颜色特征差异,判断相邻所述视频场景之间的切换位置;根据所述切换位置对所述完整视频数据进行分割处理。相应的,本申请还提供一种识别视频数据中视频场景的装置,包括:分割处理单元,用于按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据;其中,所述目标视频数据包含至少一个所述视频场景的视频帧;视频场景识别单元,用于通过预设的图像识别模型,确定所述目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;其中,所述图像识别模型为根据所述目标视频数据包含所述视频场景的特征信息对所述目标视频数据包含的所述视频场景进行分类的深度神经网络模型;视频场景权重分析单元,用于将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别的所述视频场景在所述目标视频数据中的权重值;目标视频数据获得单元,用于获得用户输入的参数信息,根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,并将所述目标视频场景返回至客户端。进一步的,所述分割处理单元具体用于:从所述参数信息中提取目标参数值;根据所述目标参数值和所述权重值的大小,从所述视频场景中获得所述权重值达到或者超过预设权重阈值的第一视频场景,将所述第一视频场景作为所述目标视频场景;其中,所述第一视频场景包含至少一个所述视频场景。进一步的,所述目标视频数据获得单元具体用于:获得待检测的所述完整视频数据;通过特征提取算法获得所述完整视频数据中所述视频场景的颜色特征;通过所述特征提取算法获得所述完整视频数据中所述视频帧的颜色特征;根据所述完整视频数据中相邻两个所述视频场景的第一颜色特征差异和所述完整视频数据中相邻两个视频帧之间的第二颜色特征差异,判断相邻所述视频场景之间的切换位置;根据所述切换位置对所述完整视频数据进行分割处理。相应的,本申请还提供一种电子设备,包括:处理器和存储器;其中,所述存储器用于存储识别视频数据中视频场景的方法的程序,该设备通电并通过所述处理器运行该识别视频数据中视频场景的方法的程序后,执行下述步骤:按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据;其中,所述目标视频数据包含至少一个所述视频场景的视频帧;通过预设的图像识别模型,确定所述目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;其中,所述图像识别模型为根据所述目标视频数据包含所述视频场景的特征信息对所述目标视频数据包含的所述视频场景进行分类的深度神经网络模型;将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别的所述视频场景在所述目标视频数据中的权重值;获得用户输入的参数信息,根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,并将所述目标视频场景返回至客户端。相应的,本申请还提供一种存储设备,存储有识别视频数据中视频场景的方法的程序,该程序被处理器运行,执行下述步骤:按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据;其中,所述目标视频数据包含至少一个所述视频场景的视频帧;通过预设的图像识别模型,确定所述目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;其中,所述图像识别模型为根据所述目标视频数据包含所述视频场景的特征信息对所述目标视频数据包含的所述视频场景进行分类的深度神经网络模型;将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别的所述视频场景在所述目标视频数据中的权重值;获得用户输入的参数信息,根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,并将所述目标视频场景返回至客户端。采用本专利技术所述的识别视频数据中视频场景的方法,能够通过预设的图像识别模型获得不同种类的所述视频场景分别包含的视频帧的置信度,本文档来自技高网...

【技术保护点】
1.一种识别视频数据中视频场景的方法,其特征在于,包括:按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据;其中,所述目标视频数据包含至少一个所述视频场景的视频帧;通过预设的图像识别模型,确定所述目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;其中,所述图像识别模型为所述目标视频数据包含的所述视频场景的特征信息对所述目标视频数据包含的所述视频场景进行分类的深度神经网络模型;将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别的所述视频场景在所述目标视频数据中的权重值;获得用户输入的参数信息,根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,并将所述目标视频场景返回至客户端。

【技术特征摘要】
1.一种识别视频数据中视频场景的方法,其特征在于,包括:按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据;其中,所述目标视频数据包含至少一个所述视频场景的视频帧;通过预设的图像识别模型,确定所述目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;其中,所述图像识别模型为所述目标视频数据包含的所述视频场景的特征信息对所述目标视频数据包含的所述视频场景进行分类的深度神经网络模型;将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别的所述视频场景在所述目标视频数据中的权重值;获得用户输入的参数信息,根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,并将所述目标视频场景返回至客户端。2.根据权利要求1所述的识别视频数据中视频场景的方法,其特征在于,所述按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据,具体包括:获得待检测的所述完整视频数据;通过特征提取算法获得所述完整视频数据中所述视频场景的颜色特征;通过所述特征提取算法获得所述完整视频数据中所述视频帧的颜色特征;根据所述完整视频数据中相邻两个所述视频场景之间的第一颜色特征差异和所述完整视频数据中相邻两个视频帧之间的第二颜色特征差异,判断相邻所述视频场景之间的切换位置;根据所述切换位置对所述完整视频数据进行分割处理。3.根据权利要求1所述的识别视频数据中视频场景的方法,其特征在于,所述根据所述参数信息和所述权重值的大小从所述视频场景中获得目标视频场景,具体包括:从所述参数信息中提取目标参数值;根据所述目标参数值和所述权重值的大小,从所述视频场景中获得所述权重值达到或者超过预设权重阈值的第一视频场景,将所述第一视频场景作为所述目标视频场景;其中,所述第一视频场景包含至少一个所述视频场景。4.根据权利要求1所述的识别视频数据中视频场景的方法,其特征在于,还包括:从所述参数信息中提取目标参数值;判断所述目标参数值是否大于所述目标视频数据所包含的所述视频场景的种类数量,若是,则向所述客户端返回告警提示信息。5.根据权利要求1所述的识别视频数据中视频场景的方法,其特征在于,所述视频帧的置信度是指所述视频帧为所述视频场景对应的视频帧的概率值。6.一种识别视频数据中视频场景的装置,其特征在于,包括:分割处理单元,用于按照待检测的完整视频数据所包含视频场景的不同对所述完整视频数据进行分割处理,获得目标视频数据;其中,所述目标视频数据包含至少一个所述视频场景的视频帧;视频场景识别单元,用于通过预设的图像识别模型,确定所述目标视频数据包含所述视频场景的种类,并获得不同种类的所述视频场景分别包含的视频帧的置信度;其中,所述图像识别模型为根据所述目标视频数据包含所述视频场景的特征信息对所述目标视频数据包含的所述视频场景进行分类的深度神经网络模型;视频场景权重分析单元,用于将不同类别的所述视频场景所包含视频帧的置信度分别做归一化处理,获得不同类别...

【专利技术属性】
技术研发人员:彭浩
申请(专利权)人:北京影谱科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1