一种模型训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:35751692 阅读:17 留言:0更新日期:2022-11-26 18:57
本申请提供了一种模型训练方法、装置、电子设备和存储介质,所述方法包括:获取目标模型,其中,所述目标模型包括一个基础网络部分和至少两个并行的全连接层,每个全连接层对应的点位特征不同,不同全连接层对应的点位特征属于同一对象;将输入图像输入所述目标模型,其中,所述输入图像携带有任务标识;根据所述任务标识确定所述输入图像已标注的点位特征;基于每个输入图像已标注的点位特征,联合训练所述目标模型中的基础网络部分和所述点位特征对应的全连接层,直至所述目标模型完全收敛。本申请提高模型训练效率。本申请提高模型训练效率。本申请提高模型训练效率。

【技术实现步骤摘要】
一种模型训练方法、装置、电子设备和存储介质


[0001]本申请涉及神经网络
,尤其涉及一种模型训练方法、装置、电子设备和存储介质。

技术介绍

[0002]随着技术的发展,关键点检测技术已经经历了飞速的发展,技术手段也相对完善,无论是应用于移动端的快速检测技术还是应用于云端的高精度检测技术均得到了飞速的发展。
[0003]针对同一个对象,目前可以设置不同的关键点检测,例如,对于人脸关键点检测,一般是106点位数据,还可以设置发际线点位的检测。如果将不同的关键点检测进行结合,可以提高检测的精准度,但这样就需要对已有数据进行重新标注,以将关键点标注在同一图像上,这会造成模型训练效率低。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种模型训练方法、装置、电子设备和存储介质。
[0005]第一方面,本申请提供了一种模型训练方法,所述方法包括:
[0006]获取目标模型,其中,所述目标模型包括一个基础网络部分和至少两个并行的全连接层,每个全连接层对应的点位特征不同,不同全连接层对应的点位特征属于同一对象;
[0007]将输入图像输入所述目标模型,其中,所述输入图像携带有任务标识;
[0008]根据所述任务标识确定所述输入图像已标注的点位特征;
[0009]基于每个输入图像已标注的点位特征,联合训练所述目标模型中的基础网络部分和所述点位特征对应的全连接层,直至所述目标模型完全收敛。
[0010]可选地,所述输入图像包括目标图像和设定图像,基于每个输入图像已标注的点位特征,联合训练所述目标模型中的基础网络部分和所述点位特征对应的全连接层包括:
[0011]通过所述目标图像中的目标点位特征,调整所述基础网络部分的内部参数和目标全连接层的内部参数,其中,所述目标全连接层采用目标点位特征进行训练;
[0012]通过所述设定图像中的设定点位特征,调整所述基础网络部分的内部参数和设定全连接层的内部参数,其中,所述设定全连接层采用设定点位特征进行训练。
[0013]可选地,通过所述目标图像中的目标点位特征,调整所述基础网络部分的内部参数和所述目标全连接层的内部参数包括:
[0014]通过所述目标全连接层输出所述目标图像中的点位识别结果;
[0015]在所述点位识别结果与所述目标点位特征不相同时,在反向传播过程中调整所述基础网络部分的内部参数和所述目标全连接层的内部参数。
[0016]可选地,通过所述设定图像中的设定点位特征,调整所述基础网络部分的内部参数和设定全连接层的内部参数包括:
[0017]通过所述设定全连接层输出所述设定图像中的点位识别结果;
[0018]在所述点位识别结果与所述设定点位特征不相同时,在反向传播过程中调整所述基础网络部分的内部参数和设定全连接层的内部参数。
[0019]可选地,直至所述目标模型完全收敛之后,所述方法还包括:
[0020]固定基础网络部分的内部参数;
[0021]通过所述目标点位特征训练目标全连接层,直至目标全连接层完全收敛;
[0022]通过所述设定点位特征训练设定全连接层,直至设定全连接层完全收敛。
[0023]可选地,获取目标模型包括:
[0024]在原有模型的基础上,增加一个全连接层,其中,所述原有模型包括所述基础网络部分和一个全连接层,所述原有模型为所述目标点位特征对应的模型或所述设定点位特征对应的模型。
[0025]可选地,所述方法还包括:
[0026]设置目标点位特征和设定点位特征在模型训练过程中的损失函数权重相同。
[0027]第二方面,提供了一种模型训练装置,所述装置包括:
[0028]获取模块,用于获取目标模型,其中,所述目标模型包括一个基础网络部分和至少两个并行的全连接层,每个全连接层对应的点位特征不同,不同全连接层对应的点位特征属于同一对象;
[0029]输入模块,用于将输入图像输入所述目标模型,其中,所述输入图像携带有任务标识;
[0030]确定模块,用于根据所述任务标识确定所述输入图像已标注的点位特征;
[0031]训练模块,用于基于每个输入图像已标注的点位特征,联合训练所述目标模型中的基础网络部分和所述点位特征对应的全连接层,直至所述目标模型完全收敛。
[0032]第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0033]存储器,用于存放计算机程序;
[0034]处理器,用于执行存储器上所存放的程序时,实现任一所述的模型训练方法步骤。
[0035]第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现任一所述的模型训练方法步骤。
[0036]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
[0037]本申请实施例提供的该方法,服务器采用了具有一个基础网络部分和两个并行的目标全连接层、设定全连接层的目标模型,并通过目标点位特征和设定点位特征联合训练目标模型,由于该模型具有两个全连接层,因此能够采用不同的点位特征对该模型进行训练,通过联合训练的方式无需已有数据进行重新标注,提高模型训练效率。
附图说明
[0038]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0039]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而
言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0040]图1为本申请实施例提供的一种模型训练方法的流程图;
[0041]图2为本申请实施例提供的106点位数据的输出结果示意图;
[0042]图3为本申请实施例提供的发际线点位数据的输出结果示意图;
[0043]图4为人脸点位特征的模型框架图;
[0044]图5为本申请实施例提供的一种模型训练装置的结构示意图;
[0045]图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0046]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0047]在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取目标模型,其中,所述目标模型包括一个基础网络部分和至少两个并行的全连接层,每个全连接层对应的点位特征不同,不同全连接层对应的点位特征属于同一对象;将输入图像输入所述目标模型,其中,所述输入图像携带有任务标识;根据所述任务标识确定所述输入图像已标注的点位特征;基于每个输入图像已标注的点位特征,联合训练所述目标模型中的基础网络部分和所述点位特征对应的全连接层,直至所述目标模型完全收敛。2.根据权利要求1所述的方法,其特征在于,所述输入图像包括目标图像和设定图像,基于每个输入图像已标注的点位特征,联合训练所述目标模型中的基础网络部分和所述点位特征对应的全连接层包括:通过所述目标图像中的目标点位特征,调整所述基础网络部分的内部参数和目标全连接层的内部参数,其中,所述目标全连接层采用目标点位特征进行训练;通过所述设定图像中的设定点位特征,调整所述基础网络部分的内部参数和设定全连接层的内部参数,其中,所述设定全连接层采用设定点位特征进行训练。3.根据权利要求2所述的方法,其特征在于,通过所述目标图像中的目标点位特征,调整所述基础网络部分的内部参数和所述目标全连接层的内部参数包括:通过所述目标全连接层输出所述目标图像中的点位识别结果;在所述点位识别结果与所述目标点位特征不相同时,在反向传播过程中调整所述基础网络部分的内部参数和所述目标全连接层的内部参数。4.根据权利要求2所述的方法,其特征在于,通过所述设定图像中的设定点位特征,调整所述基础网络部分的内部参数和设定全连接层的内部参数包括:通过所述设定全连接层输出所述设定图像中的点位识别结果;在所述点位识别结果与所述设定点位特征不相同时,在反向传播过程中调整所述基础网络部分的内部参数和设定全连接层的内部参数。5.根据权利要求...

【专利技术属性】
技术研发人员:吴佳涛
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1