视频数据的识别方法和装置、电子设备和存储介质制造方法及图纸

技术编号:35267983 阅读:20 留言:0更新日期:2022-10-19 10:33
本申请提供了一种视频数据的识别方法和装置、电子设备和存储介质,其中,该方法包括:获取待处理的目标视频片段;将所述目标视频片段输入目标模型中,得到视频特征,其中,所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息,所述目标模型是通过对初始模型的模型参数进行调整后得到的;根据所述视频特征,确定对所述目标视频片段中的视频数据的识别结果。通过本申请,解决了相关技术中存在的自动化程度较低,不能准确识别出视频片段的视频内容特征的问题。片段的视频内容特征的问题。片段的视频内容特征的问题。

【技术实现步骤摘要】
视频数据的识别方法和装置、电子设备和存储介质


[0001]本申请涉及视频图像处理领域,尤其涉及一种视频数据的识别方法和装置、电子设备和存储介质。

技术介绍

[0002]目前,在确定视频片段中出现的能够表征视频特征的介质(比如人物、背景、动作等)时,需要将视频片段中出现的图像与现有的一些图像进行图像比对,这时现有的图像对比通常是将得到的至少两张图像做相似度对比,比如使用哈希算法、直方图算法、结构相似度算法等方式完成各个图像之间的相似度度量,进而确定视频片段图像中的内容特征。
[0003]但是,上述的相关技术需要对图像进行对比式学习,自动化程度较低,且比对出来的结果与实际图像之间误差较大。
[0004]因此,相关技术在视频帧数据识别处理上存在自动化程度较低,不能准确识别出视频片段的视频内容特征的问题。

技术实现思路

[0005]本申请提供了一种视频数据的识别方法和装置、电子设备和存储介质,以至少解决相关技术中存在自动化程度较低,不能准确识别出视频片段的视频内容特征的问题。
[0006]根据本申请实施例的一个方面,提供了一种视频数据的识别方法,该方法包括:
[0007]获取待处理的目标视频片段;
[0008]将所述目标视频片段输入目标模型中,得到视频特征,其中,所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息,所述目标模型是通过对初始模型的模型参数进行调整后得到的;
[0009]根据所述视频特征,确定对所述目标视频片段中的视频数据的识别结果。
[0010]根据本申请实施例的另一个方面,还提供了一种视频数据的识别装置,该装置包括:
[0011]第一获取单元,用于获取待处理的目标视频片段;
[0012]第一输入单元,用于将所述目标视频片段输入目标模型中,得到视频特征,其中,所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息,所述目标模型是通过对初始模型的模型参数进行调整后得到的;
[0013]确定单元,用于根据所述视频特征,确定对所述目标视频片段中的视频数据的识别结果。
[0014]可选地,该装置还包括:
[0015]第二获取单元,用于在所述将所述目标视频片段输入目标模型中,得到视频特征之前,获取初始视频片段,其中,所述初始视频片段为训练所述初始模型的样本集;
[0016]划分单元,用于对所述初始视频片段进行等频帧数的划分,得到多个视频子片段,其中,所述视频子片段内包含多个视频帧,每一个所述视频子片段中的所述视频帧的数量
相同;
[0017]遮罩单元,用于利用遮罩方案对所述视频子片段进行遮罩处理,得到被遮挡的第一视频帧和未被遮挡的第二视频帧,其中,所述第一视频帧和所述第二视频帧的个数都为至少一个;
[0018]调整单元,用于根据所述第一视频帧和所述第二视频帧,调整所述初始模型的模型参数,得到所述目标模型。
[0019]可选地,遮罩单元包括:
[0020]遮罩处理模块,用于按照所述遮罩方案中的遮罩比例对所述视频子片段进行遮罩处理,得到所述第一视频帧和所述第二视频帧。
[0021]可选地,调整单元包括:
[0022]第一确定模块,用于根据所述第一视频帧,确定所述第一视频帧当前所处在的目标位置;
[0023]第二确定模块,用于根据所述第二视频帧,确定由所述第二视频帧所组成的第一序列;
[0024]调整模块,用于根据所述目标位置和所述第一序列,调整所述模型参数,得到所述目标模型。
[0025]可选地,调整模块包括:
[0026]第一输入子单元,用于将所述第一序列输入编码器内,得到编码后的第二序列;
[0027]加入子单元,用于在所述第二序列中的所述目标位置处加入多个遮罩标识,得到第三序列,其中,所述遮罩标识用于增加所述第二序列的完整度;
[0028]第二输入子单元,用于将所述第三序列输入解码器内,得到解码后的特征向量;
[0029]调整子单元,用于利用所述特征向量和损失函数,调整所述模型参数,得到所述目标模型。
[0030]可选地,调整子单元包括:
[0031]利用所述损失函数获取所述特征向量的计算结果;
[0032]根据所述计算结果反向传播更新所述模型参数,直到所述计算结果大于或者等于预设阈值时,停止对所述模型参数的调整,得到所述目标模型,其中,所述预设阈值为停止调整所述模型参数的最低值。
[0033]可选地,该装置还包括:
[0034]第三获取单元,用于获取下游任务信息;
[0035]第二输入单元,用于将所述目标视频片段对应的原始视频帧序列输入编码器内,得到编码后的第四序列;
[0036]结合单元,用于将所述第四序列与下游任务信息进行结合,得到结合后的应用结果。
[0037]根据本申请实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行上述任一实施例中的方法步骤。
[0038]根据本申请实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储
介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一实施例中的方法步骤。
[0039]本申请实施例可以应用于深度学习
进行计算机视觉,在本申请实施例中,通过获取待处理的目标视频片段;将目标视频片段输入目标模型中,得到视频特征,其中,目标模型用于得出能够表征目标视频片段内包含的视频的特征信息,目标模型是通过对初始模型的模型参数进行调整后得到的;根据视频特征,确定对目标视频片段中的视频数据的识别结果。由于本申请实施例通过利用训练好的目标模型对获取的待处理的目标视频片段进行处理,得到相应的视频特征,通过该视频特征是可以识别出目标视频片段内视频数据的内容特征的,比如是背景、人物还是执行的某些动作等,进而实现自动识别的效果,同时在整个视频数据识别之前,也实现了视频自监督编码器预训练,这样由初始模型预训练完成后的目标模型得到的视频数据的识别结果更加准确和便捷,进而解决了相关技术中存在的自动化程度较低,不能准确识别出视频片段的视频内容特征的问题。
附图说明
[0040]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0041]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0042]图1是根据本专利技术实施例的一种可选的视频数据的识别方法的硬件环境的示意图;
[0043]图2是根据本申请实施例的一种可选的视频数据的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频数据的识别方法,其特征在于,所述方法包括:获取待处理的目标视频片段;将所述目标视频片段输入目标模型中,得到视频特征,其中,所述目标模型用于得出能够表征所述目标视频片段内包含的视频的特征信息,所述目标模型是通过对初始模型的模型参数进行调整后得到的;根据所述视频特征,确定对所述目标视频片段中的视频数据的识别结果。2.根据权利要求1所述的方法,其特征在于,在所述将所述目标视频片段输入目标模型中,得到视频特征之前,所述方法还包括:获取初始视频片段,其中,所述初始视频片段为训练所述初始模型的样本集;对所述初始视频片段进行等频帧数的划分,得到多个视频子片段,其中,所述视频子片段内包含多个视频帧,每一个所述视频子片段中的所述视频帧的数量相同;利用遮罩方案对所述视频子片段进行遮罩处理,得到被遮挡的第一视频帧和未被遮挡的第二视频帧,其中,所述第一视频帧和所述第二视频帧的个数都为至少一个;根据所述第一视频帧和所述第二视频帧,调整所述初始模型的模型参数,得到所述目标模型。3.根据权利要求2所述的方法,其特征在于,所述利用遮罩方案对所述视频子片段进行遮罩处理,得到被遮挡的第一视频帧和未被遮挡的第二视频帧包括:按照所述遮罩方案中的遮罩比例对所述视频子片段进行遮罩处理,得到所述第一视频帧和所述第二视频帧。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一视频帧和所述第二视频帧,调整所述初始模型的模型参数,得到所述目标模型包括:根据所述第一视频帧,确定所述第一视频帧当前所处在的目标位置;根据所述第二视频帧,确定由所述第二视频帧所组成的第一序列;根据所述目标位置和所述第一序列,调整所述模型参数,得到所述目标模型。5.根据权利要求4所述的方法,其特征在于,所述根据所述目标位置和所述第一序列,调整所述模型参数,得到所述目标模型包括:将所述第一序列输入编码器内,得到编码后的第二序列;在所述...

【专利技术属性】
技术研发人员:胡郡郡唐大闰
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1