【技术实现步骤摘要】
训练数据集确定方法、行为分析方法、装置、系统及介质
本申请实施例涉及深度学习
,特别涉及一种训练数据集确定方法、行为分析方法、装置、系统及介质。
技术介绍
随着深度学习技术的发展,对视频中对象的行为进行分析的行为分析网络模型广泛普及。行为分析网络模型通常是通过训练数据集训练得到,然后被部署在服务器中或者终端设备(如智能摄像头)上,用于识别视频中存在的行为以及行为的位置等。其中,训练数据集包括视频段和视频段对应的标注信息。在相关技术中,对于训练数据集的确定,通常是由研发人员在计算机设备上标注视频段中行为的位置等,得到对应的标注信息,将视频段和对应的标注信息作为训练数据集。然而,通过研发人员确定训练数据集,技术门槛比较高,而且用户想要定制某个特定行为的行为分析网络模型时,定制周期比较长。
技术实现思路
本申请实施例提供了一种训练数据集确定方法、行为分析方法、装置、系统及介质,能够降低确定训练数据集的技术门槛,缩短定制行为分析网络模型的定制周期。所述技术方案如下:一方面,提供了一种训练数据集确定方法,所述方法包括:显示多个视频段中每个视频段包括的视频图像;当检测到所述多个视频段的视频图像中一个或多个行为的标注操作时,确定所述多个视频段中每个视频段对应的标注信息;显示网络结构和/或训练参数不同的多个初始分析网络模型的性能信息,所述多个初始分析网络模型均用于视频中的行为分析;当基于显示的性能信息检测到模型选择操作时,根据所述多个视频段以及对应的标 ...
【技术保护点】
1.一种训练数据集确定方法,其特征在于,所述方法包括:/n显示多个视频段中每个视频段包括的视频图像;/n当检测到所述多个视频段的视频图像中一个或多个行为的标注操作时,确定所述多个视频段中每个视频段对应的标注信息;/n显示网络结构和/或训练参数不同的多个初始分析网络模型的性能信息,所述多个初始分析网络模型均用于视频中的行为分析;/n当基于显示的性能信息检测到模型选择操作时,根据所述多个视频段以及对应的标注信息,确定所述模型选择操作所选择的初始分析网络模型对应的训练数据集。/n
【技术特征摘要】 【专利技术属性】
1.一种训练数据集确定方法,其特征在于,所述方法包括:
显示多个视频段中每个视频段包括的视频图像;
当检测到所述多个视频段的视频图像中一个或多个行为的标注操作时,确定所述多个视频段中每个视频段对应的标注信息;
显示网络结构和/或训练参数不同的多个初始分析网络模型的性能信息,所述多个初始分析网络模型均用于视频中的行为分析;
当基于显示的性能信息检测到模型选择操作时,根据所述多个视频段以及对应的标注信息,确定所述模型选择操作所选择的初始分析网络模型对应的训练数据集。
2.根据权利要求1所述的方法,其特征在于,所述多个初始分析网络模型包括网络结构和/或训练参数不同的多个初始图像分析网络模型,以及网络结构和/或训练参数不同的多个初始视频分析网络模型;
所述根据所述多个视频段以及对应的标注信息,确定所述模型选择操作所选择的初始分析网络模型对应的训练数据集,包括:
根据所述多个视频段以及对应的标注信息,确定图像数据集,将所述图像数据集作为所述模型选择操作所选择的初始图像分析网络模型对应的训练数据集;和/或
根据所述多个视频段以及对应的标注信息,确定视频数据集,将所述视频数据集作为所述模型选择操作所选择的初始视频分析网络模型的训练数据集。
3.根据权利要求2所述的方法,其特征在于,所述标注信息包括行为标签和行为位置之间的对应关系,所述行为位置包括行为发生的帧号和图像区域,所述多个视频段中的每个视频段具有一个或多个行为标签,每个行为标签对应多个帧号,每个帧号对应一个图像区域;
所述根据所述多个视频段以及对应的标注信息,确定图像数据集,包括:
对于所述多个视频段中的第一视频段,提取所述第一视频段中经过标注的部分或全部的视频图像,得到多个第一视频图像,所述第一视频段为所述多个视频段中的一个;
从所述对应关系中获取所述多个第一视频图像中每个第一视频图像的帧号所对应的行为标签以及行为位置,作为相应的第一视频图像对应的标注信息;
将所述多个视频段中提取出的视频图像以及对应的标注信息,确定为所述图像数据集。
4.根据权利要求2所述的方法,其特征在于,所述标注信息包括行为标签和行为位置之间的对应关系,所述行为位置包括行为发生的帧号和图像区域,所述多个视频段中的每个视频段具有一个或多个行为标签,每个行为标签对应多个帧号,每个帧号对应一个图像区域,所述多个帧号包括一个起始帧号和一个结束帧号;
所述根据所述多个视频段以及对应的标注信息,确定视频数据集,包括:
对于所述多个视频段中的第一视频段,提取所述第一视频段的各个行为标签所对应的起始帧号和结束帧号之间的视频片段,得到一个或多个第一子视频段,所述第一视频段为所述多个视频段中的一个;
从所述对应关系中获取各个第一子视频段的行为标签所对应的行为位置,将各个第一子视频段的行为标签和对应的行为位置作为相应的第一子视频段对应的标注信息;
将所述多个视频段中提取出的子视频段以及对应的标注信息,确定为所述视频数据集。
5.根据权利要求2所述的方法,其特征在于,所述根据所述多个视频段以及对应的标注信息,确定所述模型选择操作所选择的初始分析网络模型对应的训练数据集之后,所述方法还包括:
根据所述图像数据集,对所述模型选择操作所选择的初始图像分析网络模型进行训练,得到图像行为分析网络模型;和/或,
根据所述视频数据集,对所述模型选择操作所选择的初始视频分析网络模型进行训练,得到视频行为分析网络模型。
6.根据权利要求5所述的方法,其特征在于,对所述模型选择操作所选择的初始分析网络模型进行训练之前,所述方法还包括:
显示所述模型选择操作所选择的初始分析网络模型的网络结构和/或训练参数的调整指示信息;
当基于所述调整指示信息检测到调整操作时,按照所述调整操作对所述模型选择操作所选择的初始分析网络模型的网络结构和/或训练参数进行调整。
技术研发人员:童俊艳,赵飞,任烨,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。