一种目标识别模型的训练方法和装置制造方法及图纸

技术编号:27608123 阅读:19 留言:0更新日期:2021-03-10 10:33
本申请提供了一种目标识别模型的训练方法和装置,属于深度学习技术领域。该方法包括:将样本图像输入初始识别模型,得到初始识别模型中的训练概率序列,其中,训练概率序列为包含样本图像中样本对象所有关联动作的概率的序列;通过样本概率序列、训练概率序列以及损失函数,对初始识别模型进行训练,直至样本概率序列与训练概率序列的损失值不大于预设阈值,得到训练后的目标识别模型,其中,部分样本概率序列来自第一识别模型,第一识别模型的网络层数不少于初始识别模型的网络层数。本申请通过网络层数较多的第一识别模型对网络层数较少的初始识别模型进行训练,减少模型复杂度,降低算法计算量,提供模型训练效率。提供模型训练效率。提供模型训练效率。

【技术实现步骤摘要】
一种目标识别模型的训练方法和装置


[0001]本申请涉及深度学习
,尤其涉及一种目标识别模型的训练方法和装置。

技术介绍

[0002]随着图像视频捕捉设备制造技术、视频存储与解析技术的飞速发展,人们已经能够快速便捷地获取更加多样化和更加复杂化的视频图像。根据视频捕捉设备记录的图像序列,识别计算机识别视频中发生的动作已经成为计算机视觉与模式识别
重要的一个分支。
[0003]目前大多数人体动作识别的深度学习算法都是基于RGB数据,RGB数据采用的深度神经网络的网络层数过多,造成算法复杂度高,计算量大,计算效率低。

技术实现思路

[0004]本申请实施例的目的在于提供一种目标识别模型的训练方法和装置,以解决识别网络算法复杂的问题。具体技术方案如下:
[0005]第一方面,提供了一种目标识别模型的训练方法,所述方法包括:
[0006]将样本图像输入初始识别模型,得到所述初始识别模型中的训练概率序列,其中,所述训练概率序列为包含所述样本图像中样本对象所有关联动作的概率的序列;
[0007]通过样本概率序列、所述训练概率序列以及损失函数,对所述初始识别模型进行训练,直至所述样本概率序列与所述训练概率序列的损失值不大于预设阈值,得到训练后的目标识别模型,其中,部分所述样本概率序列来自第一识别模型,所述第一识别模型的网络层数不少于所述初始识别模型的网络层数。
[0008]可选地,在得到训练后的目标识别模型之后,所述方法还包括:
[0009]将目标图像输入所述目标识别模型,得到所述目标识别模型中的目标概率序列;
[0010]将多个目标训练概率的加权平均结果作为最终概率序列;
[0011]选取所述最终概率序列中最大概率值对应的动作类别,作为所述目标图像中目标对象的目标动作类别。
[0012]可选地,所述损失函数包括第一损失函数和第二损失函数,所述样本概率序列包括第一概率序列和第二概率序列,所述第一概率序列为已训练好的第一识别模型中的包含正确动作概率的序列,所述第二概率序列为包含标签动作概率的序列,所述通过样本概率序列、所述训练概率序列以及损失函数,对所述初始识别模型进行训练,直至所述样本概率序列与所述训练概率序列的损失值不大于预设阈值,得到训练后的目标识别模型包括:
[0013]通过所述第一概率序列和所述训练概率序列对所述初始识别模型进行训练,直至所述第一概率序列与所述训练概率序列的第一损失值不大于第一阈值,并通过所述第二概率序列和所述训练概率序列对所述初始识别模型进行训练,直至所述第二概率序列与所述训练概率序列的第二损失值不大于第二阈值;
[0014]确定包含目标损失值的目标损失函数,其中,所述目标损失值是由所述第一损失
值与所述第二损失值的加权求和得到的;
[0015]将训练好的初始识别模型作为所述目标识别模型。
[0016]可选地,通过样本概率序列、所述训练概率序列以及损失函数,对所述初始识别模型进行训练之前,所述方法还包括:
[0017]将所述样本图像输入训练好的第一识别模型,得到所述第一识别模型中的第二概率序列,其中,所述第二概率序列为包含所述样本图像中样本对象当前执行的动作的概率的序列;
[0018]获取所有第一识别模型中的第二概率序列;
[0019]将所有所述第二概率序列的加权平均结果作为所述第一概率序列。
[0020]可选地,在将所述样本图像输入训练好的第一识别模型之前,所述方法还包括:
[0021]获取所述样本图像,其中,所述样本图像包括深度图像和从压缩视频中提取的编码帧图像、运动矢量图像与残差帧图像;
[0022]通过所述样本图像对第二识别模型进行训练,得到训练后的所述第一识别模型。
[0023]可选地,所述通过所述样本图像对第二识别模型进行训练,得到训练后的所述第一识别模型包括:
[0024]将所述样本图像输入到所述第二识别模型,得到所述第二识别模型输出的识别结果,其中,所述识别结果用于表示所述样本图像中样本对象动作的所属类别;
[0025]在所述识别结果与所述样本图像的标注结果不一致的情况下,调整所述第二识别模型的模型参数,得到所述第一识别模型,其中,在所述第一识别模型输出的所述识别结果与所述标注结果一致,所述标注结果用于表示所述样本图像中样本对象动作的所属类别。
[0026]第二方面,提供了一种目标识别模型的训练装置,所述装置包括:
[0027]第一输入模块,用于将样本图像输入初始识别模型,得到所述初始识别模型中的训练概率序列,其中,所述训练概率序列为包含所述样本图像中样本对象所有关联动作的概率的序列;
[0028]训练模块,用于通过样本概率序列、所述训练概率序列以及损失函数,对所述初始识别模型进行训练,直至所述样本概率序列与所述训练概率序列的损失值不大于预设阈值,得到训练后的目标识别模型,其中,部分所述样本概率序列来自第一识别模型,所述第一识别模型的网络层数不少于所述初始识别模型的网络层数。
[0029]可选地,所述装置还包括:
[0030]第二输入模块,用于将目标图像输入所述目标识别模型,得到所述目标识别模型中的目标概率序列;
[0031]作为模块,用于将多个目标训练概率的加权平均结果作为最终概率序列;
[0032]选取模块,用于选取所述最终概率序列中最大概率值对应的动作类别,作为所述目标图像中目标对象的目标动作类别。
[0033]第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0034]存储器,用于存放计算机程序;
[0035]处理器,用于执行存储器上所存放的程序时,实现任一所述的方法步骤。
[0036]第四方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介
质内存储有计算机程序,所述计算机程序被处理器执行时实现任一所述的方法步骤。
[0037]本申请实施例有益效果:
[0038]本申请实施例提供了一种目标识别模型的训练方法,方法包括:服务器将样本图像输入初始识别模型,得到初始识别模型中的训练概率序列,然后通过样本概率序列、训练概率序列以及损失函数,对初始识别模型进行训练,直至样本概率序列与训练概率序列的损失值不大于预设阈值,得到训练后的目标识别模型,其中,部分样本概率序列来自第一识别模型,第一识别模型的网络层数不少于初始识别模型的网络层数。本申请通过网络层数较多的第一识别模型对网络层数较少的初始识别模型进行训练,减少模型复杂度,降低算法计算量,提供模型训练效率。
[0039]当然,实施本申请的任一产品或方法并不一定需要同时达到以上的所有优点。
附图说明
[0040]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标识别模型的训练方法,其特征在于,所述方法包括:将样本图像输入初始识别模型,得到所述初始识别模型中的训练概率序列,其中,所述训练概率序列为包含所述样本图像中样本对象所有关联动作的概率的序列;通过样本概率序列、所述训练概率序列以及损失函数,对所述初始识别模型进行训练,直至所述样本概率序列与所述训练概率序列的损失值不大于预设阈值,得到训练后的目标识别模型,其中,部分所述样本概率序列来自第一识别模型,所述第一识别模型的网络层数不少于所述初始识别模型的网络层数。2.根据权利要求1所述的方法,其特征在于,在得到训练后的目标识别模型之后,所述方法还包括:将目标图像输入所述目标识别模型,得到所述目标识别模型中的目标概率序列;将多个目标训练概率的加权平均结果作为最终概率序列;选取所述最终概率序列中最大概率值对应的动作类别,作为所述目标图像中目标对象的目标动作类别。3.根据权利要求1所述的方法,其特征在于,所述损失函数包括第一损失函数和第二损失函数,所述样本概率序列包括第一概率序列和第二概率序列,所述第一概率序列为已训练好的第一识别模型中的包含正确动作概率的序列,所述第二概率序列为包含标签动作概率的序列,所述通过样本概率序列、所述训练概率序列以及损失函数,对所述初始识别模型进行训练,直至所述样本概率序列与所述训练概率序列的损失值不大于预设阈值,得到训练后的目标识别模型包括:通过所述第一概率序列和所述训练概率序列对所述初始识别模型进行训练,直至所述第一概率序列与所述训练概率序列的第一损失值不大于第一阈值,并通过所述第二概率序列和所述训练概率序列对所述初始识别模型进行训练,直至所述第二概率序列与所述训练概率序列的第二损失值不大于第二阈值;确定包含目标损失值的目标损失函数,其中,所述目标损失值是由所述第一损失值与所述第二损失值的加权求和得到的;将训练好的初始识别模型作为所述目标识别模型。4.根据权利要求3所述的方法,其特征在于,通过样本概率序列、所述训练概率序列以及损失函数,对所述初始识别模型进行训练之前,所述方法还包括:将所述样本图像输入训练好的第一识别模型,得到所述第一识别模型中的第二概率序列,其中,所述第二概率序列为包含所述样本图像中样本对象当前执行的动作的概率的序列;获取所有第一识别模型中的第二概率序列;将所有所述第二概率序列的加权平均结果作为所述第一概率序列。5...

【专利技术属性】
技术研发人员:古仁华
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1