视频标注方法及装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:33293202 阅读:45 留言:0更新日期:2022-05-01 00:16
本申请公开了一种视频标注方法及装置、电子设备及计算机可读存储介质。该方法包括:获取待标注视频和对象检测模型;通过使用所述对象检测模型检测所述待标注视频的多个视频帧,得到所述待标注视频的第一标注结果;在检测到针对所述第一标注结果的编辑指令的情况下,依据所述编辑指令编辑所述第一标注结果,得到所述待标注视频的第二标注结果。述待标注视频的第二标注结果。述待标注视频的第二标注结果。

【技术实现步骤摘要】
视频标注方法及装置、电子设备及计算机可读存储介质


[0001]本申请涉及计算机视觉
,尤其涉及一种视频标注方法及装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着计算机视觉技术的发展,计算机视觉技术的应用越来越广,其中就包括使用计算机视觉模型执行任务。例如,使用对象检测模型检测视频中是否包括目标对象,又例如,使用事件检测模型检测视频中是否包括待检测事件。
[0003]在使用计算机视觉模型执行任务之前,需要对计算机视觉模型进行测试,以确认计算机视觉模型具备执行任务的能力。而计算机视觉模型的测试需要使用非常大数量的携带标注信息的测试视频。因此,如何获取测试视频的标注信息具有非常重要的意义。

技术实现思路

[0004]本申请提供一种视频标注方法及装置、电子设备及计算机可读存储介质。
[0005]第一方面,提供了一种视频标注方法,所述方法包括:
[0006]获取待标注视频和对象检测模型;
[0007]通过使用所述对象检测模型检测所述待标注视频的多个视频帧,得到所述待标注视频的第一标注结果;
[0008]在检测到针对所述第一标注结果的编辑指令的情况下,依据所述编辑指令编辑所述第一标注结果,得到所述待标注视频的第二标注结果。
[0009]结合本申请任一实施方式,所述通过使用所述对象检测模型检测所述待标注视频的各个视频帧,得到所述待标注视频的第一标注结果,包括:
[0010]通过使用所述对象检测模型检测所述待标注视频的多个视频帧,得到所述待标注视频的第三标注结果;
[0011]获取所述待标注视频的多个视频帧的感兴趣区域的位置信息;
[0012]依据处于所述感兴趣区域内的所述第三标注结果,得到所述待标注视频的第一标注结果。
[0013]结合本申请任一实施方式,所述依据处于所述感兴趣区域内的所述第三标注结果,得到所述待标注视频的第一标注结果,包括:
[0014]依据处于所述感兴趣区域内的所述第三标注结果,从所述待标注视频中确定包括目标对象的至少一个目标视频帧;
[0015]根据所述至少一个目标视频帧,得到所述目标对象在所述待标注视频中出现的视频帧区间;
[0016]根据所述视频帧区间,确定所述待标注视频的第一标注结果。
[0017]结合本申请任一实施方式,根据所述视频帧区间,确定所述待标注视频的第一标注结果,包括:
[0018]确定所述视频帧区间内所述目标对象的至少两个检测框;
[0019]合并所述目标对象的至少两个检测框,得到合并后的检测框;
[0020]根据所述合并后的检测框,得到所述待标注视频的第一标注结果。
[0021]结合本申请任一实施方式,所述视频帧区间的播放时长大于时长阈值。
[0022]结合本申请任一实施方式,所述依据所述编辑指令编辑所述第一标注结果,得到所述待标注视频的第二标注结果,包括:
[0023]对所述第一标注结果执行所述编辑指令所指示的编辑操作,得到所述待标注视频的第二标注结果,所述编辑操作包括以下至少一种:修改所述目标对象在所述待标注视频中的检测框的位置,删除所述目标对象在所述待标注视频中的检测框。
[0024]结合本申请任一实施方式,所述依据所述编辑指令编辑所述第一标注结果,得到所述待标注视频的第二标注结果,包括:
[0025]对所述第一标注结果执行所述编辑指令所指示的编辑操作,得到所述待标注视频的第二标注结果,所述编辑操作包括:修改目标对象的类别。
[0026]结合本申请任一实施方式,所述编辑操作还包括新增所述目标对象在所述待标注视频中的目标检测框。
[0027]第二方面,提供了一种视频标注装置,所述装置包括:
[0028]获取单元,用于获取待标注视频和对象检测模型;
[0029]第一处理单元,用于通过使用所述对象检测模型检测所述待标注视频的多个视频帧,得到所述待标注视频的第一标注结果;
[0030]第二处理单元,用于在检测到针对所述第一标注结果的编辑指令的情况下,依据所述编辑指令编辑所述第一标注结果,得到所述待标注视频的第二标注结果。
[0031]结合本申请任一实施方式,所述第一处理单元,用于:
[0032]通过使用所述对象检测模型检测所述待标注视频的多个视频帧,得到所述待标注视频的第三标注结果;
[0033]获取所述待标注视频的多个视频帧的感兴趣区域的位置信息;
[0034]依据处于所述感兴趣区域内的所述第三标注结果,得到所述待标注视频的第一标注结果。
[0035]结合本申请任一实施方式,所述第一处理单元,用于:
[0036]依据处于所述感兴趣区域内的所述第三标注结果,从所述待标注视频中确定包括目标对象的至少一个目标视频帧;
[0037]根据所述至少一个目标视频帧,得到所述目标对象在所述待标注视频中出现的视频帧区间;
[0038]根据所述视频帧区间,确定所述待标注视频的第一标注结果。
[0039]结合本申请任一实施方式,所述第一处理单元,用于:
[0040]确定所述视频帧区间内所述目标对象的至少两个检测框;
[0041]合并所述目标对象的至少两个检测框,得到合并后的检测框;
[0042]根据所述合并后的检测框,得到所述待标注视频的第一标注结果。
[0043]结合本申请任一实施方式,所述视频帧区间的播放时长大于时长阈值。
[0044]结合本申请任一实施方式,结合本申请任一实施方式,所述第二处理单元,用于:
[0045]对所述第一标注结果执行所述编辑指令所指示的编辑操作,得到所述待标注视频的第二标注结果,所述编辑操作包括以下至少一种:修改所述目标对象在所述待标注视频中的检测框的位置,删除所述目标对象在所述待标注视频中的检测框。
[0046]结合本申请任一实施方式,结合本申请任一实施方式,所述第二处理单元,用于:
[0047]对所述第一标注结果执行所述编辑指令所指示的编辑操作,得到所述待标注视频的第二标注结果,所述编辑操作包括:修改目标对象的类别。
[0048]结合本申请任一实施方式,所述编辑操作还包括新增所述目标对象在所述待标注视频中的目标检测框。
[0049]第三方面,提供了一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
[0050]第四方面,提供了另一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
[0051]第五方面,提供了一种计算机可读存储介质,所述计算机可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频标注方法,其特征在于,所述方法包括:获取待标注视频和对象检测模型;通过使用所述对象检测模型检测所述待标注视频的多个视频帧,得到所述待标注视频的第一标注结果;在检测到针对所述第一标注结果的编辑指令的情况下,依据所述编辑指令编辑所述第一标注结果,得到所述待标注视频的第二标注结果。2.根据权利要求1所述的方法,其特征在于,所述通过使用所述对象检测模型检测所述待标注视频的各个视频帧,得到所述待标注视频的第一标注结果,包括:通过使用所述对象检测模型检测所述待标注视频的多个视频帧,得到所述待标注视频的第三标注结果;获取所述待标注视频的多个视频帧的感兴趣区域的位置信息;依据处于所述感兴趣区域内的所述第三标注结果,得到所述待标注视频的第一标注结果。3.根据权利要求2所述的方法,其特征在于,所述依据处于所述感兴趣区域内的所述第三标注结果,得到所述待标注视频的第一标注结果,包括:依据处于所述感兴趣区域内的所述第三标注结果,从所述待标注视频中确定包括目标对象的至少一个目标视频帧;根据所述至少一个目标视频帧,得到所述目标对象在所述待标注视频中出现的视频帧区间;根据所述视频帧区间,确定所述待标注视频的第一标注结果。4.根据权利要求3所述的方法,其特征在于,所述根据所述视频帧区间,确定所述待标注视频的第一标注结果,包括:确定所述视频帧区间内所述目标对象的至少两个检测框;合并所述目标对象的至少两个检测框,得到合并后的检测框;根据所述合并后的检测框,得到所述待标注视频的第一标注结果。5.根据权利要求3所述的方法,其特征在于,所述视频帧区间的播放时长大于时长阈值。6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述依据所述编...

【专利技术属性】
技术研发人员:戴瑞康潘贤民
申请(专利权)人:深圳市商汤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1