识别模型的参数获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26033870 阅读:25 留言:0更新日期:2020-10-23 21:11
本发明专利技术涉及数据处理技术,揭露了一种识别模型的参数获取方法,包括:获取包含噪声标签的训练数据集,对训练数据集进行数据标准化处理,得到标准数据集;建立识别模型,利用标准数据集对所述识别模型进行训练,得到包含初始化参数的标准识别模型;构建标准数据集的噪声概率转移矩阵;基于噪声概率转移矩阵构建损失函数;利用损失函数计算标准识别模型的更新参数,将更新参数替换为初始化参数。此外,本发明专利技术还涉及区块链技术,训练数据集可存储于区块链节点中。本发明专利技术还揭露一种识别模型的参数获取装置、电子设备及存储介质。本发明专利技术可以提高获取到的模型参数的精确度。

【技术实现步骤摘要】
识别模型的参数获取方法、装置、电子设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种识别模型的参数获取方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着人工智能的兴起,越来越多的技术人员利用带有标签的数据训练搭建好的模型,以获取需要的模型参数,进而利用模型参数让模型实现特定的功能。但一个模型的训练往往需要海量的带有标签的数据,人工手动对这些数据进行标记不仅标记效率低下且在标记过程中会出现大量错误的标签,即噪声标签,而利用带有噪声标签的数据对模型进行训练无法获取精确的模型参数。因此如何利用这些带有噪声标签的数据来训练模型以获取更加精准的模型参数,成为了人们越来越关注的重点。
技术实现思路
本专利技术提供一种识别模型的参数获取方法、装置、电子设备及计算机可读存储介质,其主要目的在于提供一种提高获取到的模型参数的精确度的方法。为实现上述目的,本专利技术提供的一种识别模型的参数获取方法,包括:获取包含噪声标签的训练数据集,对所述训练数据集进行数据标准化处理,得到标准数据集;基于多层深度神经网络建立识别模型,利用所述标准数据集对所述识别模型进行训练,得到包含初始化参数的标准识别模型;构建所述标准数据集的噪声概率转移矩阵;基于所述噪声概率转移矩阵构建损失函数;利用所述损失函数计算所述标准识别模型的更新参数,将所述更新参数替换为所述初始化参数。可选地,所述对所述训练数据集进行数据标准化处理,包括下述一种或几种的组合:去除所述训练数据集中的唯一属性值;对所述训练数据集进行缺失值填充;对所述训练数据集进行数据归一化。可选地,所述对所述训练数据集进行数据归一化,包括:利用如下标准化算法对所述训练数据集进行数据归一化:其中,x为数据归一化后的标准数据,Sold为所述训练数据集中的数据,Smax为Sold取值的最大值,Smin为Sold取值的最小值。可选地,所述噪声概率转移矩阵,包括:Q∈[0,1]c×c其中,c的大小与标准数据集中标准数据的数量相同。可选地,所述损失函数包括前向损失函数,所述前向损失函数为:其中,QT为所述噪声概率转移矩阵的转置矩阵,ψ为所述识别模型的误差因子,h为所述多层深度神经网络,为所述前向损失函数的损失值。可选地,所述损失函数还包括后向损失函数,所述后项损失函数为:其中,l→(h)为所述后向损失函数的损失值,y为所述标准数据集中任一标准数据x的预设标准标签,为所述标准识别模型对x的预测标签,Q为所述噪声概率转移矩阵,p(x,y)为标准数据x与x对应的预设标准标签y的联合分布,为p(x,y)的预测值。可选地,所述利用所述损失函数计算所述标准识别模型的更新参数,包括:获取所述标准数据集中标准数据的预设标准标签,以及所述标准识别模型对所述标准数据集中标准数据的预测标签;利用损失函数计算所述预测标签与所述标准标签之间的差异值;当所述差异值在预设阈值区间内时,利用梯度下降算法计算所述标准识别模型的更新参数;当所述差异值大于所述阈值区间的上限时,利用所述损失函数计算所述标准标签为噪声标签的概率值;当所述概率值小于预设概率阈值时,利用梯度下降算法计算所述标准识别模型的更新参数。为了解决上述问题,本专利技术还提供一种识别模型的参数获取装置,所述装置包括:训练数据获取模块,用于获取包含噪声标签的训练数据集,对所述训练数据集进行数据标准化处理,得到标准数据集;识别模型构建模块,用于基于多层深度神经网络建立识别模型,利用所述标准数据集对所述识别模型进行训练,得到包含初始化参数的标准识别模型;转移矩阵构建模块,用于构建所述标准数据集的噪声概率转移矩阵;损失函数构建模块,用于基于所述噪声概率转移矩阵构建损失函数;模型参数更新模块,用于利用所述损失函数计算所述标准识别模型的更新参数,将所述更新参数替换为所述初始化参数。为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现上述中任意一项所述的识别模型的参数获取方法。为了解决上述问题,本专利技术还提供一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现上述中任意一项所述的识别模型的参数获取方法。本专利技术实施例通过获取包含噪声标签的训练数据集之后,对训练数据集进行标准化处理,提高对训练数据进行处理的效率;在得到包含初始化参数的标准识别模型之后,构建所述标准数据集的噪声概率转移矩阵,利于提高根据所述噪声转移矩阵构建出的损失函数对模型的适用性,以便于后续利用损失函数训练出更加精确的模型参数;基于所述噪声概率转移矩阵构建损失函数,利用损失函数计算标准识别模型的更新参数,从而能够得到更准确的模型参数,实现提高获取模型参数的精确性的目的。因此本专利技术提出的识别模型的参数获取方法、装置及计算机可读存储介质,可以提供一种提高获取模型参数的精确度的方法。附图说明图1为本专利技术一实施例提供的识别模型的参数获取方法的流程示意图;图2为本专利技术一实施例提供的识别模型的参数获取装置的模块示意图;图3为本专利技术一实施例提供的实现识别模型的参数获取方法的电子设备的内部结构示意图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本申请实施例提供的识别模型的参数获取方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述识别模型的参数获取方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。本专利技术提供一种识别模型的参数获取方法。参照图1所示,为本专利技术一实施例提供的识别模型的参数获取方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。在本实施例中,识别模型的参数获取方法包括:S1、获取包含噪声标签的训练数据集,对所述训练数据集进行数据标准化处理,得到标准数据集。本专利技术实施例中,所述包含噪声标签的训练数据集是指训练数据集中存在一些数据,但数据的预设标准标签与数据的内容不对应,即预设标准标签是噪声标签的数据。本专利技术实施例可利用具有数据抓取功能的python语句从区块链节点中获取所述训练数据集,也可从数据库中获取所述训练数据集。较佳地,所述训练数据集存储于区块链的不同节点中,利用区块链的高数据吞吐性,可提高获取所述训练数据集的效率。具体地,所述对所述训本文档来自技高网...

【技术保护点】
1.一种识别模型的参数获取方法,其特征在于,所述方法包括:/n获取包含噪声标签的训练数据集,对所述训练数据集进行数据标准化处理,得到标准数据集;/n基于多层深度神经网络建立识别模型,利用所述标准数据集对所述识别模型进行训练,得到包含初始化参数的标准识别模型;/n构建所述标准数据集的噪声概率转移矩阵;/n基于所述噪声概率转移矩阵构建损失函数;/n利用所述损失函数计算所述标准识别模型的更新参数,将所述更新参数替换为所述初始化参数。/n

【技术特征摘要】
1.一种识别模型的参数获取方法,其特征在于,所述方法包括:
获取包含噪声标签的训练数据集,对所述训练数据集进行数据标准化处理,得到标准数据集;
基于多层深度神经网络建立识别模型,利用所述标准数据集对所述识别模型进行训练,得到包含初始化参数的标准识别模型;
构建所述标准数据集的噪声概率转移矩阵;
基于所述噪声概率转移矩阵构建损失函数;
利用所述损失函数计算所述标准识别模型的更新参数,将所述更新参数替换为所述初始化参数。


2.如权利要求1所述的识别模型的参数获取方法,其特征在于,所述对所述训练数据集进行数据标准化处理,包括下述一种或几种的组合:
去除所述训练数据集中的唯一属性值;
对所述训练数据集进行缺失值填充;
对所述训练数据集进行数据归一化。


3.如权利要求2所述的识别模型的参数获取方法,其特征在于,所述对所述训练数据集进行数据归一化,包括:
利用如下标准化算法对所述训练数据集进行数据归一化:



其中,x为数据归一化后的标准数据,Sold为所述训练数据集中的数据,Smax为Sold取值的最大值,Smin为Sold取值的最小值。


4.如权利要求1所述的识别模型的参数获取方法,其特征在于,所述噪声概率转移矩阵,包括:
Q∈[0,1]c×c
其中,c的大小与标准数据集中标准数据的数量相同。


5.如权利要求1所述的识别模型的参数获取方法,其特征在于,所述损失函数包括前向损失函数,所述前向损失函数为:



其中,QT为所述噪声概率转移矩阵的转置矩阵,ψ为所述识别模型的误差因子,h为所述多层深度神经网络,为所述前向损失函数的损失值。


6.如权利要求3所述的识别模型的参数获取方法,其特征在于,所述损失函数还包括后向损失函数,所述后项损失函数为:



其中,l→(h)为所述后向损失函数的损失值,y为所述标准数据集中任一标准数据x的预设标准标签,为所述标准识别模型对x的预测标签,Q...

【专利技术属性】
技术研发人员:凡金龙刘莉红刘玉宇
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1