应用于模型训练的样本数据处理方法及装置制造方法及图纸

技术编号:33436250 阅读:18 留言:0更新日期:2022-05-19 00:24
本发明专利技术公开了应用于模型训练的样本数据处理方法及装置,包括:获取待训练的若干个样本视频;根据待识别的所有异常行为的类别将若干个样本视频进行分组得到若干样本视频组;对每个样本视频组执行融合操作得到每个样本视频组对应的融合样本视频;根据所有融合样本视频对预先确定出的识别模型进行训练得到训练后的识别模型,训练后的识别模型用于识别任一目标视频中是否存在异常行为以及当存在时进一步确定所涉及的具体异常行为。可见,本发明专利技术能够根据由多个样本视频生成的融合样本视频对识别模型进行训练,不仅能够提高识别模型的训练效率,还能够实现多类别异常行为的识别,降低了多类别异常行为的识别复杂度,提高了多类别异常行为的识别效率。类别异常行为的识别效率。类别异常行为的识别效率。

【技术实现步骤摘要】
应用于模型训练的样本数据处理方法及装置


[0001]本专利技术涉及信息处理
,尤其涉及一种应用于模型训练的样本数据处理方法及装置。

技术介绍

[0002]随着电子技术的快速发展,在智能监控
,除了采集视频实现对监控区域的实时监控之外,还需要进一步对采集到的视频所包含的视频内容进行分析,进而识别视频中是否存在异常行为,如人员摔倒行为、局部高温行为等。
[0003]在实际应用中,为了识别采集到的视频中是否存在异常行为,除了人为识别之外,还可以通过大量的样本视频训练预先确定出的识别模型,而后将训练好的识别模型应用于智能监控
,实现对采集到的视频中的异常行为的实时识别,还可以进一步实现异常行为的智能化提醒,以便于相关人员快速且有效的对异常行为进行处理。然而,实践发现,当前训练识别模型时用到的样本视频中的异常行为类别较为单一,若要实现多类别异常行为的识别,就需要通过多个样本视频集合分别对识别模型进行训练,得到多个不同类别的识别模型,进而分别用于识别不同类别的异常行为,且当需要识别多类别异常行为时,需要加载多个不同类别的识别模型才能够实现,操作复杂。可见,如何降低多类别异常行为的识别复杂度显得尤为重要。

技术实现思路

[0004]本专利技术提供了一种应用于模型训练的样本数据处理方法及装置,能够降低多类别异常行为的识别复杂度。
[0005]本专利技术第一方面公开了一种应用于模型训练的样本数据处理方法,所述方法包括:
[0006]获取待训练的若干个样本视频;
[0007]根据待识别的所有目标异常行为的异常行为类别,将若干个所述样本视频进行分组,得到若干个样本视频组,每个所述样本视频组包括至少两个所述样本视频,且每个所述样本视频组包括的所有所述样本视频所涉及的所有异常行为包括所有所述目标异常行为;
[0008]对每个所述样本视频组执行视频融合操作,得到每个所述样本视频组对应的融合样本视频;
[0009]根据所有所述融合样本视频对预先确定出的识别模型进行训练,得到训练后的识别模型,所述训练后的识别模型用于识别任一目标视频的视频内容中是否存在异常行为以及当识别出所述目标视频的视频内容中存在异常行为时确定所述目标视频的视频内容中所存在的至少一个所述目标异常行为。
[0010]作为一种可选的实施方式,在本专利技术第一方面中,所述对每个所述样本视频组执行视频融合操作,得到每个所述样本视频组对应的融合样本视频,包括:
[0011]对于每个所述样本视频组,对该样本视频组中的所有样本视频执行第一视频拼接
操作,得到该样本视频组对应的融合样本视频;其中,所述第一视频拼接操作为时间垂直拼接操作,该样本视频组对应的融合样本视频在其对应的视频时长的任一时刻的视频内容包括该样本视频组中每个样本视频在相应时刻的视频内容。
[0012]作为一种可选的实施方式,在本专利技术第一方面中,所述对于每个所述样本视频组,对该样本视频组中的所有样本视频执行第一视频拼接操作,得到该样本视频组对应的融合样本视频之前,所述方法还包括:
[0013]对于每个所述样本视频组,统计该样本视频组中每个样本视频的时长并计算该样本视频组中所有样本视频的时长之和,得到该样本视频组对应的总视频时长;判断该样本视频组对应的总视频时长是否小于等于预先确定出的视频时长阈值,当判断结果为否时,触发执行所述的对该样本视频组中的所有样本视频执行第一视频拼接操作,得到该样本视频组对应的融合样本视频的操作;当判断结果为是时,对该样本视频组中的所有样本视频执行第二视频拼接操作,得到该样本视频组对应的融合样本视频,其中,所述第二视频拼接操作为时间水平拼接操作,该样本视频组对应的融合样本视频在其对应的视频时长的任一时刻的视频内容为该样本视频组中的其中一个样本视频在相应时刻的视频内容。
[0014]作为一种可选的实施方式,在本专利技术第一方面中,所述获取待训练的若干个样本视频之后,所述方法还包括:
[0015]判断所有所述样本视频中是否存在至少一个目标样本视频,其中,所述目标样本视频对应的异常行为标注信息包括两种或两种以上的异常行为类别;
[0016]当判断出存在至少一个所述目标样本视频时,根据预先确定出的异常行为筛选因子从每个所述目标样本视频对应的异常行为标注信息所包括的所有异常行为类别中筛选每个所述目标样本视频对应的训练用异常行为类别,并隐藏每个所述目标样本视频对应的异常行为标注信息所包括的所有异常行为类别中除筛选出的训练用异常行为类别之外的所有异常行为类别,以更新所有所述目标样本视频对应的异常行为标注信息。
[0017]作为一种可选的实施方式,在本专利技术第一方面中,所述根据待识别的所有目标异常行为的异常行为类别,将若干个所述样本视频进行分组,得到若干个样本视频组,包括:
[0018]根据待识别的所有目标异常行为的异常行为类别以及每个所述样本视频对应的异常行为标注信息,将所有所述样本视频划分成多个样本视频集合,每个所述样本视频集合包括多个样本视频,一个所述样本视频集合对应一个所述目标异常行为的异常行为类别,同一所述样本视频集合中样本视频对应的异常行为标注信息均相同,不同所述样本视频集合中样本视频对应的异常行为标注信息均不同;
[0019]分别从每个所述样本视频集合中选取一个样本视频,将分别从每个所述样本视频集合中选取的样本视频确定为一个样本视频组;
[0020]判断确定出的所有所述样本视频组的数量是否达到第一预设数量阈值,当判断结果为否时,重复执行所述的分别从每个所述样本视频集合中选取一个样本视频,将分别从每个所述样本视频集合中选取的样本视频确定为一个样本视频组的操作,直至确定出的所有所述样本视频组的数量达到所述第一预设数量阈值。
[0021]作为一种可选的实施方式,在本专利技术第一方面中,所述分别从每个所述样本视频集合中选取一个样本视频,将分别从每个所述样本视频集合中选取的样本视频确定为一个样本视频组之前,所述方法还包括:
[0022]对于任一所述样本视频集合,判断该样本视频集合所包括的样本视频的总数量是否小于第二预设数量阈值;当判断出该样本视频集合所包括的样本视频的总数量小于所述第二预设数量阈值时,根据该样本视频集合对应的异常行为类别对该样本视频集合执行相同异常行为类别的样本视频补充操作直至该样本视频集合包括的样本视频的总数量不小于所述第二预设数量阈值。
[0023]作为一种可选的实施方式,在本专利技术第一方面中,所述分别从每个所述样本视频集合中选取一个样本视频,包括:
[0024]从其中一个所述样本视频集合的未被选取过的所有样本视频中选择其中一个样本视频作为基准样本视频,获取所述基准样本视频对应的视频信息作为基准信息,并分别从剩余所述样本视频集合的未被选取过的所有样本视频中筛选对应的视频信息与所述基准信息的匹配度大于等于预设匹配度阈值的样本视频。
[0025]本专利技术第二方面公开了一种应用于模型训练的样本数据处理装置,所述装置包括:
[0026]样本获取模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于模型训练的样本数据处理方法,其特征在于,所述方法包括:获取待训练的若干个样本视频;根据待识别的所有目标异常行为的异常行为类别,将若干个所述样本视频进行分组,得到若干个样本视频组,每个所述样本视频组包括至少两个所述样本视频,且每个所述样本视频组包括的所有所述样本视频所涉及的所有异常行为包括所有所述目标异常行为;对每个所述样本视频组执行视频融合操作,得到每个所述样本视频组对应的融合样本视频;根据所有所述融合样本视频对预先确定出的识别模型进行训练,得到训练后的识别模型,所述训练后的识别模型用于识别任一目标视频的视频内容中是否存在异常行为以及当识别出所述目标视频的视频内容中存在异常行为时确定所述目标视频的视频内容中所存在的至少一个所述目标异常行为。2.根据权利要求1所述的应用于模型训练的样本数据处理方法,其特征在于,所述对每个所述样本视频组执行视频融合操作,得到每个所述样本视频组对应的融合样本视频,包括:对于每个所述样本视频组,对该样本视频组中的所有样本视频执行第一视频拼接操作,得到该样本视频组对应的融合样本视频;其中,所述第一视频拼接操作为时间垂直拼接操作,该样本视频组对应的融合样本视频在其对应的视频时长的任一时刻的视频内容包括该样本视频组中每个样本视频在相应时刻的视频内容。3.根据权利要求2所述的应用于模型训练的样本数据处理方法,其特征在于,所述对于每个所述样本视频组,对该样本视频组中的所有样本视频执行第一视频拼接操作,得到该样本视频组对应的融合样本视频之前,所述方法还包括:对于每个所述样本视频组,统计该样本视频组中每个样本视频的时长并计算该样本视频组中所有样本视频的时长之和,得到该样本视频组对应的总视频时长;判断该样本视频组对应的总视频时长是否小于等于预先确定出的视频时长阈值,当判断结果为否时,触发执行所述的对该样本视频组中的所有样本视频执行第一视频拼接操作,得到该样本视频组对应的融合样本视频的操作;当判断结果为是时,对该样本视频组中的所有样本视频执行第二视频拼接操作,得到该样本视频组对应的融合样本视频,其中,所述第二视频拼接操作为时间水平拼接操作,该样本视频组对应的融合样本视频在其对应的视频时长的任一时刻的视频内容为该样本视频组中的其中一个样本视频在相应时刻的视频内容。4.根据权利要求1

3任一项所述的应用于模型训练的样本数据处理方法,其特征在于,所述获取待训练的若干个样本视频之后,所述方法还包括:判断所有所述样本视频中是否存在至少一个目标样本视频,其中,所述目标样本视频对应的异常行为标注信息包括两种或两种以上的异常行为类别;当判断出存在至少一个所述目标样本视频时,根据预先确定出的异常行为筛选因子从每个所述目标样本视频对应的异常行为标注信息所包括的所有异常行为类别中筛选每个所述目标样本视频对应的训练用异常行为类别,并隐藏每个所述目标样本视频对应的异常行为标注信息所包括的所有异常行为类别中除筛选出的训练用异常行为类别之外的所有异常行为类别,以更新所有所述目标样本视频对应的异常行为标注信息。5.根据权利要求4所述的应用于模型训练的样本数据处理方法,其特征在于,所述根据
待识别的所有目标异常行为的异常行为类别,将若干个所述样本视频进行分组,得到若干个样本视频组,包括:根据待识别的所有目标异常行为的异常行为类别以及每个所述样本视频对...

【专利技术属性】
技术研发人员:傅峰峰陈嘉俊
申请(专利权)人:广州富港生活智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1