模型训练、人脸图像质量评分方法、电子设备及存储介质技术

技术编号:34956427 阅读:9 留言:0更新日期:2022-09-17 12:34
本发明专利技术实施例涉及人脸图像处理领域,公开了一种模型训练、人脸图像质量评分方法、电子设备及存储介质。本发明专利技术中,模型训练方法,包括:构建用于从人脸图像提取人脸特征向量的特征编码网络,人脸特征向量作为样本服从第一正态分布;构建用于生成描述人脸图像为好质量和坏质量的两个聚类中心向量的聚类中心网络,两个聚类中心向量分别作为样本服从第二正态分布;构建分类概率模型,分类概率模型用于生成人脸图像分别属于好质量和坏质量的分类概率值;以未标注标签的人脸图像作为训练样本,对特征编码网络、聚类中心网络和分类概率模型进行联合训练,得到训练好的特征编码网络和聚类中心网络。中心网络。中心网络。

【技术实现步骤摘要】
模型训练、人脸图像质量评分方法、电子设备及存储介质


[0001]本专利技术实施例涉及人脸图像处理领域,特别涉及一种模型训练、人脸图像质量评分方法、电子设备及存储介质。

技术介绍

[0002]机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。
[0003]训练数据是指机器学习过程中用于训练算法模型的数据。算法从训练数据中学习,算法从得到的训练数据中找到关系,形成理解,做出决策,并评估信心。训练数据的质量越好,模型的表现就越好。
[0004]人脸图像质量受光照、人脸姿态角、人脸对比度、人脸完整度、人脸模糊程度、表情夸张程度、妆容浓重程度等因素影响。因此有方法采用多个对应影响人脸图像质量因素的子模块,比如分别检测人脸图像模糊程度、完整程度、姿态角大小程度的子模块,行业专家根据各个子模块的输出,综合给出人脸图像质量评分,但是搜集并标注这种方法依赖的数据集耗时耗力,难以实现人脸图像质量的快速评分。

技术实现思路

[0005]本专利技术实施方式的目的在于提供一种模型训练、人脸图像质量评分方法、电子设备及存储介质,可以实现人脸图像质量的快速评分。
[0006]为解决上述技术问题,本专利技术的实施方式提供了一种模型训练方法,包括:构建用于从人脸图像提取人脸特征向量的特征编码网络,人脸特征向量作为样本服从第一正态分布;构建用于生成描述人脸图像为好质量和坏质量的两个聚类中心向量的聚类中心网络,两个聚类中心向量分别作为样本服从第二正态分布;构建分类概率模型,分类概率模型用于生成人脸图像分别属于好质量和坏质量的分类概率值;以未标注标签的人脸图像作为训练样本,对特征编码网络、聚类中心网络和分类概率模型进行联合训练,得到训练好的特征编码网络和聚类中心网络;其中,联合训练的损失包括:人脸特征向量以对应的分类概率值靠近两个聚类中心向量的距离损失,以及利用已标注为好质量的人脸图像所对应的人脸特征向量作为样本服从的第一正态分布与两个聚类中心向量分别作为样本服从的第二正态分布之间的距离损失。
[0007]为解决上述技术问题,本专利技术的实施方式还提供了一种人脸图像质量评分方法,包括以下步骤:将待识别人脸图像输入到特征编码模型,得到待识别人脸图像对应的人脸特征向量作为样本服从的第三正态分布;根据待识别人脸图像对应的人脸特征向量作为样本服从的第三正态分布到由聚类中心模型所输出的两个聚类中心向量分别作为样本服从的第四正态分布之间的距离,确定待识别人脸图像的质量;特征编码模型和聚类中心模型
通过上述模型训练方法训练得到。
[0008]本专利技术的实施方式还提供了一种电子设备,包括:至少一个处理器;与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述模型训练方法或者人脸图像质量评分方法。
[0009]本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述模型训练方法或者人脸图像质量评分方法。
[0010]本专利技术实施方式,通过构建特征编码模型,可以对人脸图像进行编码,将人脸图像以人脸特征向量表示,通过构建聚类中心模型和分类概率模型,对人脸特征向量进行计算,将人脸图像向好质量与坏质量的两个聚类中心进行聚类。其中,通过将人脸图像的人脸特征向量、好质量人脸图像分类与坏质量人脸图像分类的聚类中心向量,分别以一个正态分布进行表示,将图像计算转化为不同正态分布之间的相关计算。基于大量未标注标签的人脸图像和少量标注为好质量的人脸图像作为训练样本,对特征编码网络、聚类中心网络和分类概率模型进行联合训练,可以有效降低数据标注的工作量,提高模型训练效率。在联合训练采用的损失中,基于人脸特征向量以对应的分类概率值靠近两个聚类中心向量的距离损失,可以有效的将人脸特征向量划分到好质量类别和坏质量类别对应的两个聚类中心向量周围;同时利用少量已标注为好质量的人脸图像所对应的人脸特征向量作为样本服从的第一正态分布与两个聚类中心向量分别作为样本服从的第二正态分布之间的距离损失,可以对无标注样本下训练的两个聚类中心进行好质量聚类中心和坏质量聚类中心的验证区分,最终确定出好坏质量聚类中心的聚类中心向量。基于训练好的特征编码网络和聚类中心网络即可对待识别人脸图像进行质量评分,实现弱监督下的人脸图像质量的评分过程。
[0011]另外,特征编码网络包括:特征编码模型和第一生成模块;构建用于从人脸图像提取人脸特征向量的特征编码网络,人脸特征向量作为样本服从第一正态分布,包括:构建特征编码模型,其输入为人脸图像、输出为第一均值向量和第一标准差向量;通过第一生成模块从标准正态分布中采样得到第一采样值向量,并通过如下公式构建第一正态分布:
[0012][0013]其中,z
n(b)
为人脸特征向量;s
n(b)
为第一采样值向量,mu
n(b)
为第一均值向量,var
n(b)
为第一标准差向量,b=1,2

,B;B为训练样本的批大小,n为向量长度。本申请中,通过从标准正态分布中采样得到第一采样值向量,以第一均值向量为均值、第一标准差向量为标准差,实现第一正态分布的构建,将图像的特征降维表示,并实现将人脸图像编码得到的人脸特征向量以一个正态分布描述。
[0014]另外,聚类中心网络包括:聚类中心模型和第二生成模块;构建用于生成描述人脸图像为好质量和坏质量的两个聚类中心向量的聚类中心网络,两个聚类中心向量分别作为样本服从第二正态分布,包括:构建聚类中心模型,其无输入且输出为用于描述人脸图像为好质量和坏质量的两个向量表达,每个向量表达包括第二均值向量和第二标准差向量;通过第二生成模块从标准正态分布中采样得到第二采样值向量,并通过如下公式构建第二正态分布:
[0015][0016]其中,C
k,n
为聚类中心向量;ss
n
为第二采样值向量,C
k,1,n
为第二均值向量,C
k,2,n
为第二标准差向量;k=1,2,分别代表好质量和坏质量,n为向量长度。本申请中,通过从标准正态分布中采样得到第二采样值向量,以第二均值向量为均值、第二标准差向量为标准差,实现第二正态分布的构建,从而实现将两个聚类中心对应的聚类中心向量,分别以一个正态分布描述。
[0017]另外,构建人脸特征以对应分类概率值所属于两个聚类中心的距离损失,包括:通过如下公式计算人脸特征以对应分类概率值所属于两个聚类中心的距离损失:
[0018][0019]其中,loss
c
为人脸特征以对应分类概率值所属于两个聚类中心的距离损失,J
k(b)
为人脸图像属于好质量和坏质量的分类概率值,va本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:构建用于从人脸图像提取人脸特征向量的特征编码网络,所述人脸特征向量作为样本服从第一正态分布;构建用于生成描述人脸图像为好质量和坏质量的两个聚类中心向量的聚类中心网络,所述两个聚类中心向量分别作为样本服从第二正态分布;构建分类概率模型,所述分类概率模型用于生成所述人脸图像分别属于好质量和坏质量的分类概率值;以未标注标签的人脸图像作为训练样本,对所述特征编码网络、所述聚类中心网络和所述分类概率模型进行联合训练,得到训练好的所述特征编码网络和所述聚类中心网络;其中,所述联合训练的损失包括:所述人脸特征向量以对应的所述分类概率值靠近所述两个聚类中心向量的距离损失,以及利用已标注为好质量的人脸图像所对应的人脸特征向量作为样本服从的第一正态分布与所述两个聚类中心向分别作为样本服从的第二正态分布之间的距离损失。2.根据权利要求1所述的模型训练方法,其特征在于,所述特征编码网络包括:特征编码模型和第一生成模块;所述构建用于从人脸图像提取人脸特征向量的特征编码网络,所述人脸特征向量作为样本服从第一正态分布,包括:构建所述特征编码模型,其输入为人脸图像、输出为第一均值向量和第一标准差向量;通过所述第一生成模块从标准正态分布中采样得到第一采样值向量,并通过如下公式构建所述第一正态分布:其中,z
n(b)
为所述人脸特征向量;s
n(b)
为所述第一采样值向量,mu
n(b)
为所述第一均值向量,var
n(b)
为所述第一标准差向量,b=1,2

,B;B为训练样本的批大小,n为向量长度。3.根据权利要求1所述的模型训练方法,其特征在于,所述聚类中心网络包括:聚类中心模型和第二生成模块;所述构建用于生成描述人脸图像为好质量和坏质量的两个聚类中心向量的聚类中心网络,所述两个聚类中心向量分别作为样本服从第二正态分布,包括:构建所述聚类中心模型,其无输入且输出为用于描述人脸图像为好质量和坏质量的两个向量表达,每个所述向量表达包括第二均值向量和第二标准差向量;通过所述第二生成模块从标准正态分布中采样得到第二采样值向量,并通过如下公式构建所述第二正态分布:其中,C
k,n
为所述聚类中心向量;ss
n
为所述第二采样值向量,C
k,1,n
为所述第二均值向量,C
k,2,n
为所述第二标准差向量;k=1,2,分别代表好质量和坏质量,n为向量长度。4.根据权利要求1

3任一项所述的模型训练方法,其特征在于,构建所述人脸特征以对应所述分类概率值所属于所述两个聚类中心的距离损失,包括:通过如下公式计算所述人脸特征以对应所述分类概率值所属于所述两个聚类中心的
距离损失:其中,loss
c
为所述人脸特征以对应所述分类概率值所属于所述两个聚类中心的距离损失,J
k(b)
为所述人脸图像属于好质量和坏质量的分类概率值,var
n(b)
为所述第一标准差向量,z
n(b)
为所述人脸特征向量,C
k,n
为所述聚类中心向量,α2为超参数,B为训练样本的批大小;b=1,2

,B;k=1,2,分别代表好质量和坏质量;n为向量长度。5.根据权利要求1

3任一项所述的模型训练方法,其特征在于,构建所述利用已标注为好质量的人脸图像所对应的所述第一正态分布与所述第二正态分布之间的距离损失,包括:将好质量的B张人脸图像输入到所述特征编码模型,得到B个好质量的第一均值向量和B个好质量的第一标准差向量,将所述B个好质量的第一均值向量的均值记为好质量均值向量,将所述B个好质量的第一标准差向量的均值记为好质量标准差向量;确定所述好质量的人脸图像的好质量人脸特征向量作为样本服从以所述好质量的第一均值向量为均值、所述好质量的第一标准差向量为标准差的好质量的第一正态分布;通过如下公式计算所述好质量的人脸图像所对应的所述第一正态分布与所述第二正态分布之间的距离损失:其中,loss
f
为所述好质量的人脸图像所对应的所述第一正态分布与所述第二正态分布之间的距离损失,KL(*1||*2)表示*1和*2的Kullback

Leibler散度;p(zg
n
)表示zg
n
的概率分布,zg
n
作为样本服从均值为所述好质量均值向量、标准差为所述好质量标准差向量的正态分布;p(C
1,n
)表示好质量的聚类中心向量C
1,n
的概率分布,C
1,n
作为样本服从均值为好质量的所述第二均值向量C
1,1,n
,标准差为好质量的...

【专利技术属性】
技术研发人员:刘冲冲付贤强何武朱海涛户磊
申请(专利权)人:合肥的卢深视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1