模型训练方法、系统、设备及介质技术方案

技术编号:32232342 阅读:18 留言:0更新日期:2022-02-09 17:36
本发明专利技术提出的一种模型训练方法、系统、设备及介质,该方法通过获取待识别图像,并进行特征提取和降维,得到降维特征,将降维特征分别输入两个预设分类及不确定性判别网络,得到两个预测概率向量,并确定基于不确定性的交叉熵损失函数,通过待识别图像和基于不确定性的交叉熵损失函数训练基础模型,以得到目标模型,通过将不确定性判断思想加入分类神经网络,从而提高了网络的学习能力,增强网络的分类精度,使得训练得到的目标模型对于不确定性图像的识别准确性大大提升。图像的识别准确性大大提升。图像的识别准确性大大提升。

【技术实现步骤摘要】
模型训练方法、系统、设备及介质


[0001]本专利技术涉及图像处理
,尤其涉及一种模型训练方法、系统、设备及介质。

技术介绍

[0002]近年来,电动摩托车和自行车的安全规范出行越来越受到重视,相关部门要求电动车出行必须佩戴安全帽。然而在日常交通行驶中,有部分人安全意识薄弱,不配戴头盔出行,极可能酿成悲剧,需要耗费大量人力去纠正这种违规行为。
[0003]随着科技的发展,人工智能技术已在智能交通领域得到了有效的推广。深度学习已经在图像分类、图象检测等领域取得了显著的成果。目前虽然能够通过卷积神经网络完成安全帽的佩戴识别,它们在利用已有的数据集学习训练深度模型的时候,不能拥有变通性的决策能力。
[0004]由于大部分图像处于高维度,且图像是非刚体,存在很多变化。由于光照、图像采集角度、距离等均会给同一物体的图像造成影响,故图像存在不确定性,这会降低机器识别过程中的准确率,导致模型的鲁棒性差,如当场景模糊且安全帽颜色与背景相似时,就容易出现识别错误,识别准确性差。现有的相关识别模型的训练往往着眼于确定性目标的训练,识别模型对于不确定性图像的识别准确性差。

技术实现思路

[0005]鉴于以上所述现有技术的缺点,本专利技术提供一种模型训练方法、系统、设备及介质,以解决上述技术问题。
[0006]本专利技术提供的一种模型训练方法,包括:
[0007]获取待识别图像,并进行特征提取和特征降维,得到若干个降维特征;
[0008]预先设置预设分类及不确定性判别网络,所述预设分类及不确定性判别网络包括第一网络和第二网络,将所述降维特征分别输入至所述第一网络和第二网络进行不确定性判别处理,分别获取各自的预测概率向量,所述预测概率向量根据预测类别概率值生成;
[0009]根据第一网络和第二网络的预测概率向量确定基于不确定性的交叉熵损失函数;
[0010]通过所述待识别图像和基于不确定性的交叉熵损失函数训练基础模型,以得到目标模型,所述基础模型包括线性分类层,所述线性分类层根据各所述预设分类及不确定性判别网络的权重矩阵确定。
[0011]可选的,将所述降维特征分别输入至所述第一网络和第二网络进行不确定性判别处理包括以下至少之一:
[0012]从所述降维特征中选取多个第一特征,并输入至第一网络进行不确定性判别处理,从所述降维特征中选取多个第二特征,并输入至第二网络进行不确定性判别处理,至少一个所述第一特征与第二特征不同;
[0013]所述第一网络从所述降维特征中选取多个第一特征进行不确定性判别处理,所述第二网络从所述降维特征中选取多个第二特征进行不确定性判别处理,至少一个所述第一
特征与第二特征不同;
[0014]从所述降维特征中选取多个第一特征,并输入至第一网络进行不确定性判别处理,从所述降维特征中选取多个第二特征,并输入至第二网络进行不确定性判别处理,各所述第一特征与第二特征相同;
[0015]所述第一网络从所述降维特征中选取多个第一特征进行不确定性判别处理,所述第二网络从所述降维特征中选取多个第二特征进行不确定性判别处理,各所述第一特征与第二特征相同。
[0016]可选的,所述基础模型的构建方式包括:
[0017]获取各所述预设分类及不确定性判别网络的权重矩阵;
[0018]根据各所述权重矩阵确定目标矩阵,并生成线性分类层;
[0019]根据所述线性分类层、预设特征提取网络和预设特征降维网络生成所述基础模型。
[0020]可选的,通过所述待识别图像和基于不确定性的交叉熵损失函数训练基础模型包括:
[0021]获取所述待识别图像的真实类别,并基于所述基础模型对所述待识别图像进行类别预测,得到预测类别;
[0022]根据所述基于不确定性的交叉熵损失函数对所述预测类别和真实类别进行收敛,得到所述目标模型。
[0023]可选的,所述基于不确定性的交叉熵损失函数包括:
[0024][0025]其中,L
ce
为基于不确定性的交叉熵损失函数,y为待识别图像所属类别的标签,p
0y
为预测概率向量p0在标签y所指位置处的值,p
1y
为预测概率向量p1在标签y所指位置处的值,p0为一个预设分类及不确定性判别网络输出的预测类别概率值,p1为另一个预设分类及不确定性判别网络输出的预测类别概率值。
[0026]可选的,所述方法还包括根据第一网络和第二网络的预测概率向量确定不确定性度,所述不确定性度的确定方式包括:
[0027][0028]其中,A为不确定性度,p
0y
为预测概率向量p0在标签y所指位置处的值,p
1y
为预测概率向量p1在标签y所指位置处的值,p0为一个预设分类及不确定性判别网络输出的预测类别概率值,p1为另一个预设分类及不确定性判别网络输出的预测类别概率值。
[0029]可选的,所述待识别图像为目标人员头部图像,所述预测类别包括佩戴安全帽或未佩戴安全帽。
[0030]可选的,所述方法还包括:
[0031]获取目标图像,所述目标图像包括待识别人员的头部图像;
[0032]将所述目标图像输入所述目标模型,得到识别结果,所述识别结果包括佩戴安全帽或未佩戴安全帽。
[0033]本专利技术还提供了一种模型训练系统,包括:
[0034]图像获取模块,用于获取待识别图像,并进行特征提取和特征降维,得到若干个降维特征;
[0035]向量获取模块,用于预先设置预设分类及不确定性判别网络,所述预设分类及不确定性判别网络包括第一网络和第二网络,将所述降维特征分别输入至所述第一网络和第二网络进行不确定性判别处理,分别获取各自的预测概率向量,所述预测概率向量根据预测类别概率值生成;
[0036]确定模块,用于根据第一网络和第二网络的预测概率向量确定基于不确定性的交叉熵损失函数;
[0037]训练模块,用于通过所述待识别图像和基于不确定性的交叉熵损失函数训练基础模型,以得到目标模型,所述基础模型包括线性分类层,所述线性分类层根据各所述预设分类及不确定性判别网络的权重矩阵确定。
[0038]本专利技术还提供了一种电子设备,包括处理器、存储器和通信总线;
[0039]所述通信总线用于将所述处理器和存储器连接;
[0040]所述处理器用于执行所述存储器中存储的计算机程序,以实现如上述中任一项实施例所述的方法。
[0041]本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,
[0042]所述计算机程序用于使所述计算机执行如上述任一项实施例所述的方法。
[0043]本专利技术的有益效果:本专利技术提出的一种模型训练方法、系统、设备及介质,该方法通过获取待识别图像,并进行特征提取和降维,得到降维特征,将降维特征分别输入到第一网络和第二网络,得到两个预测概率向量,并确定基于不确定性的交叉熵损失函数,通过待识别图像和基于不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取待识别图像,并进行特征提取和特征降维,得到若干个降维特征;预先设置预设分类及不确定性判别网络,所述预设分类及不确定性判别网络包括第一网络和第二网络,将所述降维特征分别输入至所述第一网络和第二网络进行不确定性判别处理,分别获取各自的预测概率向量,所述预测概率向量根据预测类别概率值生成;根据第一网络和第二网络的预测概率向量确定基于不确定性的交叉熵损失函数;通过所述待识别图像和基于不确定性的交叉熵损失函数训练基础模型,以得到目标模型,所述基础模型包括线性分类层,所述线性分类层根据各所述预设分类及不确定性判别网络的权重矩阵确定。2.如权利要求1所述的模型训练方法,其特征在于,将所述降维特征分别输入至所述第一网络和第二网络进行不确定性判别处理包括以下至少之一:从所述降维特征中选取多个第一特征,并输入至第一网络进行不确定性判别处理,从所述降维特征中选取多个第二特征,并输入至第二网络进行不确定性判别处理,至少一个所述第一特征与第二特征不同;所述第一网络从所述降维特征中选取多个第一特征进行不确定性判别处理,所述第二网络从所述降维特征中选取多个第二特征进行不确定性判别处理,至少一个所述第一特征与第二特征不同;从所述降维特征中选取多个第一特征,并输入至第一网络进行不确定性判别处理,从所述降维特征中选取多个第二特征,并输入至第二网络进行不确定性判别处理,各所述第一特征与第二特征相同;所述第一网络从所述降维特征中选取多个第一特征进行不确定性判别处理,所述第二网络从所述降维特征中选取多个第二特征进行不确定性判别处理,各所述第一特征与第二特征相同。3.如权利要求1所述的模型训练方法,其特征在于,所述基础模型的构建方式包括:获取各所述预设分类及不确定性判别网络的权重矩阵;根据各所述权重矩阵确定目标矩阵,并生成线性分类层;根据所述线性分类层、预设特征提取网络和预设特征降维网络生成所述基础模型。4.如权利要求1所述的模型训练方法,其特征在于,通过所述待识别图像和基于不确定性的交叉熵损失函数训练基础模型包括:获取所述待识别图像的真实类别,并基于所述基础模型对所述待识别图像进行类别预测,得到预测类别;根据所述基于不确定性的交叉熵损失函数对所述预测类别和真实类别进行收敛,得到所述目标模型。5.如权利要求4所述的模型训练方法,其特征在于,所述基于不确定性的交叉熵损失函数包括:其中,L
ce
为基于不确定性的交叉熵损失函数,y为待识别图像所属类别的标签,p
0y<...

【专利技术属性】
技术研发人员:胡源
申请(专利权)人:重庆紫光华山智安科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1