基于自适应阈值半监督的矿石分选方法和计算机存储介质技术

技术编号:37259793 阅读:22 留言:0更新日期:2023-04-20 23:34
本发明专利技术涉及基于自适应阈值半监督的矿石分选方法和计算机存储介质。该方法包括将标注矿石样本输入网络模型以获得第一预测结果,丢弃大于标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失;处理未标注矿石样本并输入网络模型以获得第一预测输出结果和第二预测输出结果;基于所述第一预设输出结果和所述第二预测输出结果得到KL散度损失,将所述交叉熵损失和所述KL散度损失相加进行反向传播,以优化所述网络模型;训练所述网络模型,然后基于训练好的所述网络模型进行矿石分选。本发明专利技术通过自适应阈值调整训练策略,实现少量标注样本下的模型训练效果接近监督学习。模型训练效果接近监督学习。模型训练效果接近监督学习。

【技术实现步骤摘要】
基于自适应阈值半监督的矿石分选方法和计算机存储介质


[0001]本专利技术涉及矿石分选领域,更具体地说,涉及一种基于自适应阈值半监督的矿石分选方法和计算机存储介质。

技术介绍

[0002]在人工智能高速发展的背景下,目前的选矿设备制造企业,通常最新的X射线透视成像+人工智能识别的技术路线。而基于卷积神经网络的识别技术,是当今图像识别的主流方式之一,其可以有效提取矿石的特征,提高分选精度。但此类识别技术属于监督学习类型,需要依靠大量标注样本进行模型的训练、测试,因此在采样、标注工作的人力、时间成本会相应提高。而且对于X射线成像的矿石来讲,不仅矿源品味会发生波动,射线本身的衰减也会导致整个图像数据分布随着时间变化,迫使每次重新训练都需要对所有新的样本进行人工标注。
[0003]半监督学习的任务是使用有限的标注数据和大量的非标注数据训练模型,以获得更好的性能。目前存在于半监督学习中的关键问题是如何从无标签数据中充分的提取有效信息。当前流行的半监督学习方法通过固定的置信度阈值使模型只关注符合固定阈值要求的标注数据和非标注数据,而其他标注数据和非标注数据将被忽略,这不但不能对数据进行充分有效的学习,还会造成错误伪标签发生的概率较高。

技术实现思路

[0004]本专利技术要解决的技术问题在于,针对现有技术中的前述问题,提供一种基于自适应阈值半监督的矿石分选方法和计算机存储介质,通过利用网络模型提取图像特征,通过自适应阈值调整训练策略,实现少量标注样本下的模型训练效果接近监督学习,从而实现高精度、低成本、大批量的矿石分选。
[0005]本专利技术解决其技术问题所采用的技术方案是:构造一种自适应阈值半监督的矿石分选方法,包括:
[0006]S1、采集矿石样本并对部分所述矿石样本进行标注获得标注矿石样本和未标注矿石样本;
[0007]S2、将标注矿石样本输入网络模型以获得第一预测结果,将所述第一预测结果与标注自适应阈值进行比较,丢弃大于所述标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失;
[0008]S3、处理所述未标注矿石样本以获得第一处理样本、第二处理样本、第三处理样本和第四处理样本,将所述第一处理样本和所述第二处理样本输入所述网络模型以获得第一预测输出结果,将所述第三处理样本和所述第四处理样本输入所述网络模型以获得第二预测输出结果;
[0009]S4、基于所述第一预设输出结果和所述第二预测输出结果得到KL散度损失,将所述交叉熵损失和所述KL散度损失相加进行反向传播,以优化所述网络模型;
[0010]S5、调整所述网络模型的超参数学习率、优化器方法并重复执行所述步骤S2

S4以训练所述网络模型,然后基于训练好的所述网络模型进行矿石分选。
[0011]在本专利技术所述的自适应阈值半监督的矿石分选方法中,在所述步骤S2中,所述标注自适应阈值α的取值范围如下:
[0012][0013]其中i表示当前迭代次数,取值为正整数;α(i)表示所述标注自适应阈值α在第i次迭代后生成值;k表示第k次迭代后开始呈现正弦式上升;μ
min
表示所述标注自适应阈值的最小值;μ
max
表示所述标注自适应阈值的最大值;
[0014]所述交叉熵失其中,N表示标注矿石样本的个数;x i
表示第i个矿石样本;y
i
表示第i个样本的真实标签;P表示预测样本的最大类别概率。
[0015]在本专利技术所述的自适应阈值半监督的矿石分选方法中,所述步骤S3进一步包括:
[0016]S31、对所述未标注矿石样本进行弱增强和强增强以分别获得第一处理样本和第二处理样本,在所述第一处理样本和所述第二处理样本中分别引入梯度噪声以生成所述第三处理样本和所述第四处理样本;
[0017]S32、将所述第一处理样本和所述第二处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第一主分类预测结果、第二主分类预测结果、第一辅助分类预测结果和第二辅助分类预测结果;
[0018]S33、将所述第三处理样本和所述第四处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第三主分类预测结果、第四主分类预测结果、第三辅助分类预测结果和第四辅助分类预测结果。
[0019]在本专利技术所述的自适应阈值半监督的矿石分选方法中,在所述步骤31中,令所述未标注矿石样本U=[U1,U2,...,U
N
]∈R
N*D
,其中R表示实数集,N表示样本个数,D表示特征维度;将符合标准正太分布的随机噪声γ注入所述未标注矿石样本U中,然后经过所述网络模型的反向传播求出梯度噪声
[0020][0021]其中D
kl
为KL散度损失计算函数,i表示迭代次数,θ表示所述网络模型的权重,u
i
表示第i次迭代下的未标注矿石样本,γ表示正态分布的随机噪声;P(y|u
i
,θ)表示输入未标注矿石样本u
i
后得到输出类别为y的概率。
[0022]在本专利技术所述的自适应阈值半监督的矿石分选方法中,所述步骤S4进一步包括:
[0023]S41、将所述第三主分类预测结果和所述第三辅助分类预测结果与未标注自适应
阈值β进行比较,将大于所述未标注自适应阈值β的所述第三主分类预测结果和所述第三辅助分类预测结果保留,其余丢弃;
[0024]S42、将所述步骤S41获得的所述第三主分类预测结果和所述第三辅助分类预测结果与所述第一主分类预测结果和第一辅助分类预测结果做KL散度损失以获得第一KL散度损失;
[0025]S43、将所述第四主分类预测结果和所述第四辅助分类预测结果与所述未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第四主分类预测结果和所述第四辅助分类预测结果保留,其余丢弃;
[0026]S44、将所述步骤S43获得的所述第四主分类预测结果和所述第四辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第二KL散度损失;
[0027]S45、将所述第一主分类预测结果和第一辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第三KL散度损失。
[0028]在本专利技术所述的自适应阈值半监督的矿石分选方法中,在所述步骤S4中,所述未标注自适应阈值β满足
[0029]其中i表示迭代次数,c表示类别,τ为设定的固定阈值;
[0030]代表第i次迭代c类的伪标签个数,为为归一化结果
[0031][0032]所述KL散度损失
[0033]N表示标注矿石样本的个数;u
i
表示第i次迭代下的未标注矿石样本;γ表示正态分布的随机噪声;d表示梯度噪声;P表示预测样本的最大类别概率。
[0034]在本专利技术所述的自适应阈值半监督的矿石分选方法中,所述网络模型包括Res本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应阈值半监督的矿石分选方法,其特征在于,包括:S1、采集矿石样本并对部分所述矿石样本进行标注获得标注矿石样本和未标注矿石样本;S2、将标注矿石样本输入网络模型以获得第一预测结果,将所述第一预测结果与标注自适应阈值进行比较,丢弃大于所述标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失;S3、处理所述未标注矿石样本以获得第一处理样本、第二处理样本、第三处理样本和第四处理样本,将所述第一处理样本和所述第二处理样本输入所述网络模型以获得第一预测输出结果,将所述第三处理样本和所述第四处理样本输入所述网络模型以获得第二预测输出结果;S4、基于所述第一预设输出结果和所述第二预测输出结果得到KL散度损失,将所述交叉熵损失和所述KL散度损失相加进行反向传播,以优化所述网络模型;S5、调整所述网络模型的超参数学习率、优化器方法并重复执行所述步骤S2

S4以训练所述网络模型,然后基于训练好的所述网络模型进行矿石分选。2.根据权利要求1所述的自适应阈值半监督的矿石分选方法,其特征在于,在所述步骤S2中,所述标注自适应阈值α的取值范围如下:其中i表示当前迭代次数,取值为正整数;α(i)表示所述标注自适应阈值α在第i次迭代后生成值;k表示第k次迭代后开始呈现正弦式上升;μ
min
表示所述标注自适应阈值的最小值;μ
max
表示所述标注自适应阈值的最大值;所述交叉熵失其中,N表示标注矿石样本的个数;x
i
表示第i个矿石样本;y
i
表示第i个样本的真实标签;P表示预测样本的最大类别概率。3.根据权利要求1所述的自适应阈值半监督的矿石分选方法,其特征在于,所述步骤S3进一步包括:S31、对所述未标注矿石样本进行弱增强和强增强以分别获得第一处理样本和第二处理样本,在所述第一处理样本和所述第二处理样本中分别引入梯度噪声以生成所述第三处理样本和所述第四处理样本;S32、将所述第一处理样本和所述第二处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第一主分类预测结果、第二主分类预测结果、第一辅助分类预测结果和第二辅助分类预测结果;S33、将所述第三处理样本和所述第四处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第三主分类预测结果、第四主分类预测结果、第三辅助分类预测结
果和第四辅助分类预测结果。4.根据权利要求3所述的自适应阈值半监督的矿石分选方法,其特征在于,在所述步骤31中,令所述未标注矿石样本U=[U1,U2,...,U
N
]∈R
N*D
,其中R表示实数集,N表示样本个数,D表示特征维度;将符合标准正太分布的随机噪声γ注入所述未标注矿石样本U中,然后经过所述网络模型的反向传播求出梯度噪声其中D
kl
为KL散度损失计算函数,i表示迭代次数,θ表示所述网络模型的权重,u
i
表示第i次迭代下的未标注矿石样本,γ表示正态分布的随机噪声;P(y|u
i
,θ)表示输入未标注矿石样本u
i
后得到输出类别为y的概率。5.根据权利要求3所述的自适应阈值半监督的矿石分选方法,其特征在于,所述步骤S4进一步包括:S41、将所述第三主分类预测结果和所述第三辅助分类预测结果与未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第三主分类预测结果和所述第三辅助分类预测结果保留,其余丢弃;S42、将所述步骤S41获得的所述第三主分类预测结果和所述第三辅助分类预测结果与...

【专利技术属性】
技术研发人员:王杉王龙
申请(专利权)人:华东交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1