一种表情识别模型的训练方法、装置以及设备制造方法及图纸

技术编号:34484222 阅读:20 留言:0更新日期:2022-08-10 09:01
本说明书实施例公开了一种表情识别模型的训练方法、装置以及设备。通过获取训练样本,所述训练样本包括身份标签和表情标签;采用第一稠密块提取所述训练样本的身份特征,以及,采用第二稠密块提取所述训练样本的表情特征;采用第三稠密块融合所述表情特征和身份特征,生成融合特征;根据所述融合特征进行身份识别和表情识别,分别生成身份识别结果和表情识别结果;根据所述身份识别结果和所述身份标签的差异确定第一损失值,根据所述表情识别结果和所述表情标签的差异确定第二损失值;融合所述第一损失值和第二损失值,确定总体损失值;根据所述总体损失值进行训练,生成目标模型。从而实现特征融合,提升对于表情的识别准确度。提升对于表情的识别准确度。提升对于表情的识别准确度。

【技术实现步骤摘要】
一种表情识别模型的训练方法、装置以及设备


[0001]本说明书涉及互联网
,尤其涉及一种表情识别模型的训练方法、装置以及设备。

技术介绍

[0002]人类的表情,比如高兴、生气、伤心等,作为一种心理状态的表达从脸部表现出来,因此可以通过人脸的表情来判断人类的心理状态,由此表情识别在人机交互中得到广泛应用。
[0003]但是在表情识别的过程中,人脸表情经常呈现不稳定、不规律的状态。不同的人表达相同的表情时会呈现出很大的差异性(即类内差异性),而同时不同的表情之间又存在一定的相似性(即类间相似性)。在实际中,也存在不同的人做相同的表情时会存在明显的差异,而同时有一部分人会采用相同的表情表达不同的心里状态,这都给表情的准确分类带来了挑战。
[0004]基于此,需要一种更为准确的表情识别模型的训练方案,以训练得到识别准确度更高的表情识别模型。

技术实现思路

[0005]本说明书一个或多个实施例提供一种表情识别模型的训练方法、装置、设备以及存储介质,用以解决如下技术问题:需要识别准确度更高的表情识别模型。
[0006]为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
[0007]在第一方面,本说明书实施例提供一种表情识别模型的训练方法,应用于包含多个结构相同的稠密块的初始模型,所述方法包括:获取训练样本,所述训练样本包括身份标签和表情标签;采用第一稠密块提取所述训练样本的身份特征,以及,采用第二稠密块提取所述训练样本的表情特征;采用第三稠密块融合所述表情特征和身份特征,生成融合特征;根据所述融合特征进行身份识别和表情识别,分别生成身份识别结果和表情识别结果;根据所述身份识别结果和所述身份标签的差异确定第一损失值,根据所述表情识别结果和所述表情标签的差异确定第二损失值;融合所述第一损失值和第二损失值,确定总体损失值;根据所述总体损失值对所述第三稠密块中的参数进行训练,生成目标模型。
[0008]在第二方面,本说明书实施例提供一种表情识别模型的训练装置,应用于包含多个结构相同的稠密块的初始模型,所述装置包括:样本获取模块,获取训练样本,所述训练样本包括身份标签和表情标签;特征提取模块,采用第一稠密块提取所述训练样本的身份特征,以及,采用第二稠密块提取所述训练样本的表情特征;特征融合模块,采用第三稠密块融合所述表情特征和身份特征,生成融合特征;识别模块,根据所述融合特征进行身份识别和表情识别,分别生成身份识别结果和表情识别结果;损失确定模块,根据所述身份识别结果和所述身份标签的差异确定第一损失值,根据所述表情识别结果和所述表情标签的差异确定第二损失值;损失融合模块,融合所述第一损失值和第二损失值,确定总体损失值;
参数训练模块,根据所述总体损失值对所述第三稠密块中的参数进行训练,生成目标模型。
[0009]在第三方面,本说明书实施例提供一种电子设备,包括:
[0010]至少一个处理器;以及,
[0011]与所述至少一个处理器通信连接的存储器;其中,
[0012]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的方法。
[0013]在第四方面,本说明书实施例提供一种非易失性计算机存储介质存储有计算机可执行指令,当计算机读取存储介质中的计算机可执行指令后,该指令使得一个或多个处理器执行如第一方面所述的方法。
[0014]本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:通过获取训练样本,所述训练样本包括身份标签和表情标签;采用第一稠密块提取所述训练样本的身份特征,以及,采用第二稠密块提取所述训练样本的表情特征;采用第三稠密块融合所述表情特征和身份特征,生成融合特征;根据所述融合特征进行身份识别和表情识别,分别生成身份识别结果和表情识别结果;根据所述身份识别结果和所述身份标签的差异确定第一损失值,根据所述表情识别结果和所述表情标签的差异确定第二损失值;融合所述第一损失值和第二损失值,确定总体损失值;根据所述总体损失值对所述第三稠密块中的参数进行训练,生成目标模型。从而实现对身份特征和表情特征的融合,以身份识别任务作为表情识别任务的辅助任务,增强包含在表情特征中的身份特征,从而提升目标模型的对于表情类别的识别准确度。
附图说明
[0015]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0016]图1为本说明书实施例提供的一种表情识别模型的训练方法的流程示意图;
[0017]图2为本说明书实施例所提供的一种稠密块的结构示意图;
[0018]图3为本说明书实施例所提供的一种训练样本的示意图;
[0019]图4为本说明书实施例所提供的一种初始模型的结构示意图;
[0020]图5为本说明书实施例所提供的一种包含预训练的模型的结构示意图;
[0021]图6为本说明书实施例所提供的一种目标模型的结构示意图;
[0022]图7为本说明书实施例提供的一种表情识别模型的训练装置的结构示意图;
[0023]图8为本说明书实施例提供的一种电子设备的结构示意图。
具体实施方式
[0024]本说明书实施例提供一种表情识别模型的训练方法、装置、设备以及存储介质。
[0025]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域
普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0026]如图1所示,图1为本说明书实施例提供的一种表情识别模型的训练方法的流程示意图,应用于包含多个结构相同的稠密块的初始模型,具体包括以下步骤:
[0027]S101:获取训练样本,所述训练样本包括身份标签和表情标签。
[0028]在本说明书实施例中,稠密块(dense block)是一种具有紧密连接性质的卷积神经网络。在稠密块中可以包括多稠密层,其中的任何两层都有直接连接,每一层的输入都是前面所有层输出的并集(即每一层的输入是前面所有层输出的拼接,这里的拼接是指通道层面上的拼接),而这一层学习到的特征也会被直接传递到后面的所有层作为输入。
[0029]换言之,本说明书实施例所涉及的稠密块中,每层的输出的通道数都不变,而输入通道数都在增加。例如,对于一个N层的稠密块而言,输入的初始特征的大小可以是A
×
B
×
C,其输出特征的大小是D
×
E
×
F,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表情识别模型的训练方法,应用于包含多个结构相同的稠密块的初始模型,所述方法包括:获取训练样本,所述训练样本包括身份标签和表情标签;采用第一稠密块提取所述训练样本的身份特征,以及,采用第二稠密块提取所述训练样本的表情特征;采用第三稠密块融合所述表情特征和身份特征,生成融合特征;根据所述融合特征进行身份识别和表情识别,分别生成身份识别结果和表情识别结果;根据所述身份识别结果和所述身份标签的差异确定第一损失值,以及,根据所述表情识别结果和所述表情标签的差异确定第二损失值;融合所述第一损失值和第二损失值,确定总体损失值;根据所述总体损失值对所述第三稠密块中的参数进行训练,生成目标模型。2.如权利要求1所述的方法,其中,所述第二稠密块中包含第二预设参数,所述第二预设参数基于如下预训练方式得到:采用所述第二稠密块提取训练样本的表情特征;采用第四稠密块根据所述表情特征进行表情识别,生成预训练表情识别结果;根据所述预训练表情识别结果和所述表情标签的差异对所述第二稠密块和所述第四稠密块进行预训练,生成可用的表情识别模型;将所述可用的表情识别模型中的第二稠密块的参数确定为所述第二预设参数。3.如权利要求2所述的方法,其中,还包括:将所述可用的表情识别模型中的第四稠密块的参数迁移至所述第三稠密块中,确定为所述第三稠密块的第三预设参数。4.如权利要求3所述的方法,其中,根据所述总体损失值对所述第三稠密块中的参数进行训练,生成目标模型,包括:维持所述第一稠密块中的第一预设参数和所述第二稠密块中的第二预设参数不变,根据所述总体损失值对所述第三稠密块中的第三预设参数进行训练,生成目标模型。5.如权利要求1所述的方法,其中,采用第三稠密块融合所述表情特征和身份特征,生成融合特征,包括:拼接所述表情特征和身份特征,生成拼接特征;对所述拼接特征依次进行卷积操作和池化操作,生成所述第三稠密块的输入特征;所述第三稠密块根据所述输入特征生成输出特征;对所述输出特征依次进行批标准化和全局平均池化操作,生成融合特征。6.如权利要求1所述的方法,其中,根据所述融合特征进行身份识别和表情识别,分别生成身份识别结果和表情识别结果,包括:将所述融合特征作为第一线性全连...

【专利技术属性】
技术研发人员:武文琦
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1