模型训练方法、图像识别方法、装置及终端设备制造方法及图纸

技术编号:24709246 阅读:31 留言:0更新日期:2020-07-01 00:09
本发明专利技术提供一种模型训练方法、图像识别方法、装置及终端设备,该图像识别方法包括:获取待识别的非完整图像;将非完整图像输入到图像恢复模型中,输出非完整图像对应的完整图像;所述图像恢复模型是基于分阶段递进的训练过程预先训练得到,训练过程中的训练样本包括非完整图像以及非完整图像的二值图,所述二值图用于调整训练过程中模型的与生成图像特征表达相关的模型参数;将完整图像输入到预先训练的图像识别模型中,输出表示非完整图像的图像对象信息的识别结果。本发明专利技术的实施例,可以保证图像恢复效果,且将复杂的识别非完整图像的任务,转换为常规的完整图像识别任务,从而大大提高识别的鲁棒性和精确度,降低识别复杂度。

【技术实现步骤摘要】
模型训练方法、图像识别方法、装置及终端设备
本专利技术涉及图像处理
,尤其涉及一种模型训练方法、图像识别方法、装置及终端设备。
技术介绍
人脸识别作为最广泛被社会认可的技术之一,几乎在每个领域都能见到它的身影。公安机关的公民身份审核、金融领域的用户征信、保险行业用户信息等一系列的应用中,人脸识别技术都是一个必不可少的参与者。随着技术的不断发展,人脸识别技术的识别精度也在不断的刷新纪录,到目前为止已经无限趋近于百分之百的识别准确率。但上述情况有一个前提条件,提供的待识别人脸图像均为无遮挡、无缺失的,一旦出现遮挡或缺失,目前的人脸识别技术很难达到预期的效果,因此需对有遮挡或缺失的人脸图像进行恢复。对于有遮挡或缺失的人脸图像,目前常用的图像恢复方法为:基于传统机器学习的方法来实现,即人工构造相应的人脸特征,并利用传统的机器学习方法,如稀疏表达和字典学习等,来重建人脸被遮挡的区域。然而,此类图像恢复方法中训练的模型比较简单,难以学习到复杂特征数据之间的变换关系,使得图像恢复效果差,造成利用此模型对非完整图像进行识别时的识别准确率低。...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:/n将获取的随机噪声输入到预先搭建的对抗网络模型的生成器中,获得第一生成样本;/n将所述第一生成样本和第一标签样本输入到所述对抗网络模型的判别器中,对所述第一标签样本和所述第一生成样本进行分类判断;其中,所述第一标签样本为具有预设图像特征分布的完整图像;/n确定所述对抗网络模型的损失值,以基于所述损失值更新所述对抗网络模型的参数数值;其中,在所述对抗网络模型的损失值未达到预设阈值时,进入下一轮迭代训练过程,直到所述对抗网络模型的损失值达到预设阈值,得到初始训练模型;/n将获取的图像训练样本输入到所述初始训练模型的生成器中,获得第二生成样本;其中,所述图像...

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
将获取的随机噪声输入到预先搭建的对抗网络模型的生成器中,获得第一生成样本;
将所述第一生成样本和第一标签样本输入到所述对抗网络模型的判别器中,对所述第一标签样本和所述第一生成样本进行分类判断;其中,所述第一标签样本为具有预设图像特征分布的完整图像;
确定所述对抗网络模型的损失值,以基于所述损失值更新所述对抗网络模型的参数数值;其中,在所述对抗网络模型的损失值未达到预设阈值时,进入下一轮迭代训练过程,直到所述对抗网络模型的损失值达到预设阈值,得到初始训练模型;
将获取的图像训练样本输入到所述初始训练模型的生成器中,获得第二生成样本;其中,所述图像训练样本为非完整图像;
将所述第二生成样本和第二标签样本输入到所述初始训练模型的判别器中,对所述第二标签样本和所述第二生成样本进行分类判断;其中,所述第二标签样本包括所述图像训练样本和所述图像训练样本的二值图;
确定所述初始训练模型的损失值,以基于所述损失值更新所述初始训练模型的参数数值;其中,在所述初始训练模型的损失值未达到预设阈值时,进入下一轮迭代训练过程,直到所述初始训练模型的损失值达到预设阈值,得到图像恢复模型。


2.根据权利要求1所述的方法,其特征在于,用于所述初始训练模型训练的损失函数为:
V=EPdata(x)logD(x)+EPg(x)log(1-D(x))
其中,V表示损失函数值,EPdata(x)表示判别器端的损失值,EPg(x)表示生成器端的损失值,x表示生成器或判别器的输入,D(x)表示判别器的输出结果。


3.根据权利要求1所述的方法,其特征在于,用于所述图像恢复模型训练的损失函数为:
Loss=Lp(z)+Lc(z|y,M)
Lp(z)=λlog(1-D(G(z)))
Lc(z|y,M)=||W⊙(G(z)-y)||1



其中,Loss表示损失函数值,Lp(z)表示判别器端的先验损失值,Lc表示生成器端的图像内容损失值,z表示输入生成器的图像训练样本,G(z)表示生成器的输出结果,y表示输入判别器的图像训练样本,M表示输入判别器的图像训练样本的二值图,其中像素i属于完整图像区域时,Mi等于1,而像素i属于非完整图像区域时,Mi等于0,λ表示预设权重参数,N(i)表示以像素i为中心的预设局部区域中除像素i之外所有像素点的个数,⊙表示针对每个像素单独点乘,||||1表示差的绝对值,Wi表示像素i的预设权重。


4.根据权利要求1所述的方法,其特征在于,所述生成器的结构包括多个卷积层,每个卷积层中包括对应的响应函...

【专利技术属性】
技术研发人员:李威
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1