视频数据识别方法、装置、设备和存储介质制造方法及图纸

技术编号:32968244 阅读:12 留言:0更新日期:2022-04-09 11:28
本发明专利技术公开了一种视频数据识别方法、装置、设备和存储介质。该方法包括:根据查询请求确定视频数据的查询目标和时间范围;其中,在时间范围内,视频数据包括多帧顺序编号的图像数据;确定当前参考帧的图像数据的查询目标识别结果;确定当前关键帧的图像数据与当前参考帧的图像数据的相似度;在当前关键帧的图像数据与当前参考帧的图像数据的相似度大于或等于第一阈值时,复用当前参考帧的图像数据的查询目标识别结果为当前关键帧的图像数据的查询目标识别结果;将当前关键帧作为当前参考帧,下一关键帧作为当前关键帧,对下一关键帧的图像数据进行查询目标识别,直至确定查询请求的识别结果,可以在保证识别精度的基础上提高视频数据的识别速度。高视频数据的识别速度。高视频数据的识别速度。

【技术实现步骤摘要】
视频数据识别方法、装置、设备和存储介质


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种视频数据识别方法、装置、设备和存储介质。

技术介绍

[0002]随着深度学习在计算机视觉领域的深入应用,众多深度学习模型在图像识别上的成绩进一步得到提升,可以在极短的时间内完成图像中数千类物体的识别。与此同时,视频数据作为含有丰富且有价值信息的媒介,借助于网络技术的快速发展已经成为重要的数据资源之一。视频数据带来了丰富的资源,但也为相关检索带了负担。当深度学习模型用于视频数据中的目标识别时,能够满足用户多样化的检索需要,完成视频语义的丰富分析,为用户提供大量有价值的信息。示例性地,用户想要对网络学院视频数据中“渔船+人物”这一场景进行定位,便可使用深度学习模型对目标进行识别,从而快速查找到对应视频与场景。在深度学习模型用于视频数据中的目标识别时,识别的速率比较慢,耗时较长,难以满足视频数据的识别需求。特别是当多用户进行不同目标的定位时,为系统带来了重复检索的开销。
[0003]现有技术中,为了提高视频数据的识别速度,一方面可以对视频数据进行抽帧处理,选取视频数据中的关键帧进行目标识别,并将该帧的识别结果进行复用,作为多帧的识别结果进行返回。通过抽帧处理可以提高视频数据的处理速度,但是极大的降低了深度学习模型的识别精度,返回的多帧识别结果容易出现误差,难以满足高识别精度的需求场景。另一方面可以压缩深度学习模型,将能够识别上千种目标的深度学习模型压缩成为只能够识别单个目标,从而提高单个目标的识别速度。由于视频数据中目标众多,场景复杂,此时深度学习模型只对单个目标识别,没有对视频数据做到有效利用,与此同时降低了深度学习模型的通用性。当多个用户需要识别多个目标时,无法进行识别结果的复用。

技术实现思路

[0004]本专利技术实施例提供一种视频数据识别方法、装置、设备和存储介质,以实现在保证识别精度的基础上提高视频数据的识别速度,同时保证了视频数据识别的通用性。
[0005]第一方面,本专利技术实施例提供了一种视频数据识别方法,包括:
[0006]根据查询请求确定视频数据的查询目标和时间范围;其中,在所述时间范围内,所述视频数据包括多帧顺序编号的图像数据;
[0007]确定当前参考帧的所述图像数据的查询目标识别结果;
[0008]确定当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度;
[0009]在当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度大于或等于第一阈值时,复用当前参考帧的所述图像数据的查询目标识别结果为当前关键帧的所述图像数据的查询目标识别结果;
[0010]将当前关键帧作为当前参考帧,下一关键帧作为当前关键帧,对所述下一关键帧的图像数据进行查询目标识别,直至确定所述查询请求的识别结果。
[0011]可选地,根据查询请求确定视频数据的查询目标和时间范围,包括:
[0012]根据同义词检索确定所述视频数据内对应所述查询请求的查询目标;
[0013]根据所述查询请求的查询范围确定所述视频数据对应的时间范围;
[0014]将所述时间范围内的视频数据转换为图像数据,形成多帧顺序编号的图像数据。
[0015]可选地,确定当前参考帧的所述图像数据的查询目标识别结果,包括:
[0016]若当前参考帧的所述图像数据为所述时间范围内的视频数据对应的第一帧图像数据,则对当前参考帧的所述图像数据进行查询目标识别,确定当前参考帧的所述图像数据的查询目标识别结果。
[0017]可选地,对当前参考帧的所述图像数据进行查询目标识别,包括:
[0018]通过目标识别深度学习模型对当前参考帧的所述图像数据进行查询目标识别。
[0019]可选地,确定当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度,包括:
[0020]对所述图像数据进行尺寸处理,使所述当前关键帧的图像数据和所述当前参考帧的图像数据具有相同长度的哈希值;
[0021]根据所述图像数据的图像灰度均值与像素的灰度分别计算所述当前关键帧的图像数据的哈希值和所述当前参考帧的图像数据的哈希值;
[0022]根据所述当前关键帧的图像数据的哈希值和所述参考值的图像数据的哈希值计算汉明距离,作为所述当前关键帧的图像数据与所述当前参考帧的图像数据的相似度。
[0023]可选地,在确定当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度之后,还包括:
[0024]在当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度小于所述第一阈值时,对所述当前关键帧的所述图像数据进行查询目标识别。
[0025]可选地,在确定所述查询请求的识别结果之后,还包括:
[0026]根据下一查询请求确定所述视频数据的下一查询目标和下一时间范围;
[0027]在所述视频数据的时间范围覆盖所述下一时间范围时,根据所述查询请求的识别结果确定识别精度;
[0028]在所述识别精度大于或等于所述下一查询请求的识别精度阈值时,复用所述查询请求的识别结果为所述下一查询请求的识别结果。
[0029]第二方面,本专利技术实施例还提供了一种视频数据识别装置,包括:
[0030]查询处理单元,用于根据查询请求确定视频数据的查询目标和时间范围;其中,在所述时间范围内,所述视频数据包括多帧顺序编号的图像数据;
[0031]当前参考帧识别确定单元,用于确定当前参考帧的所述图像数据的查询目标识别结果;
[0032]差异分析单元,用于确定当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度;
[0033]复用单元,用于在当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度大于或等于第一阈值时,复用当前参考帧的所述图像数据的查询目标识别结果为当前关键帧的所述图像数据的查询目标识别结果;
[0034]循环单元,用于将当前关键帧作为当前参考帧,下一关键帧作为当前关键帧,对所
述下一关键帧的图像数据进行查询目标识别,直至确定所述查询请求的识别结果。
[0035]第三方面,本专利技术实施例还提供了一种服务器,所述服务器包括:
[0036]一个或多个处理器;
[0037]存储装置,用于存储一个或多个程序;
[0038]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的视频数据识别方法。
[0039]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的视频数据识别方法。
[0040]本专利技术实施例的技术方案,通过在视频数据的识别过程中,可以先对不同的关键帧的图像数据进行目标差异分析,在当前关键帧的图像数据与当前参考帧的图像数据的相似度大于或等于第一阈值时,即不同的关键帧的图像数据的差异性比较小时,复用当前参考帧的图像数据的查询目标识别结果为当前关键帧的图像数据的查询目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频数据识别方法,其特征在于,包括:根据查询请求确定视频数据的查询目标和时间范围;其中,在所述时间范围内,所述视频数据包括多帧顺序编号的图像数据;确定当前参考帧的所述图像数据的查询目标识别结果;确定当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度;在当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度大于或等于第一阈值时,复用当前参考帧的所述图像数据的查询目标识别结果为当前关键帧的所述图像数据的查询目标识别结果;将当前关键帧作为当前参考帧,下一关键帧作为当前关键帧,对所述下一关键帧的图像数据进行查询目标识别,直至确定所述查询请求的识别结果。2.根据权利要求1所述的方法,其特征在于,根据查询请求确定视频数据的查询目标和时间范围,包括:根据同义词检索确定所述视频数据内对应所述查询请求的查询目标;根据所述查询请求的查询范围确定所述视频数据对应的时间范围;将所述时间范围内的视频数据转换为图像数据,形成多帧顺序编号的图像数据。3.根据权利要求1所述的方法,其特征在于,确定当前参考帧的所述图像数据的查询目标识别结果,包括:若当前参考帧的所述图像数据为所述时间范围内的视频数据对应的第一帧图像数据,则对当前参考帧的所述图像数据进行查询目标识别,确定当前参考帧的所述图像数据的查询目标识别结果。4.根据权利要求3所述的方法,其特征在于,对当前参考帧的所述图像数据进行查询目标识别,包括:通过目标识别深度学习模型对当前参考帧的所述图像数据进行查询目标识别。5.根据权利要求1所述的方法,其特征在于,确定当前关键帧的所述图像数据与当前参考帧的所述图像数据的相似度,包括:对所述图像数据进行尺寸处理,使所述当前关键帧的图像数据和所述当前参考帧的图像数据具有相同长度的哈希值;根据所述图像数据的图像灰度均值与像素的灰度分别计算所述当前关键帧的图像数据的哈希值和所述当前参考帧的图像数据的哈希值;根据所述当前关键帧的图像数据的哈希值和所述参考值的图像数据的哈希值计算汉明距离,作为所述当前关键帧的图像数据与所述当前参考帧的图像数...

【专利技术属性】
技术研发人员:刘言杰王凯田红策张磊孙蕾
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1