System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种基于回归预测主动学习框架的样本去噪方法、装置、存储介质及设备,属于土木建筑材料科学。
技术介绍
1、在现代的土木建筑材料科学应用中,建立准确的回归预测模型对于解决混凝土强度数据去噪至关重要。传统的机器学习方法通常需要大量标记样本来训练模型,但标记样本的获取和标注往往需要大量人力、时间和资源投入。此外,现实世界中的标记样本往往存在噪声和不确定性,这可能导致构建的预测模型的准确性和鲁棒性下降。
2、为了克服这些问题,主动学习作为一种有效的策略被引入。主动学习通过选择对模型构建最有帮助的样本来进行标记,从而降低标记样本的需求。然而,传统的主动学习方法主要关注无标签样本的选择和标记,而忽略了标签样本中的噪声问题。对于带有标签噪声的样本,错误的标记可能导致模型的不准确性。
技术实现思路
1、本专利技术的目的在于提供一种基于回归预测主动学习框架的样本去噪方法、装置、存储介质及设备,解决现有技术中存在的混凝土强度数据中噪声过多的问题。
2、为实现以上目的,本专利技术是采用下述技术方案实现的:
3、第一方面,本专利技术提供了一种基于回归预测主动学习框架的样本去噪方法,包括:
4、获取样本集,所述样本集为混凝土强度数据集;
5、将所述样本集输入到构建好的回归预测主动学习框架中,得到去噪样本集,完成样本去噪;
6、在所述回归预测主动学习框架中执行以下操作:
7、s01、将样本集中的有标签样本划分入有标
8、s02、若迭代次数能够被重标记频次整除,则进入调整阶段,计算有标签样本集中噪声最大的有标签样本并取出;若迭代次数不能被重标记频次整除,则进入探索阶段,计算无标签样本集中具有最大方差的无标签样本并取出;
9、s03、将噪声最大的有标签样本送入构建好的学习器中得到学习标签,将所述学习标签添加至噪声最大的有标签样本后将该有标签样本放回有标签样本集中,对具有最大方差的无标签样本添加伪标签后放入有标签样本集中,完成对有标签样本集和无标签样本集的调整;
10、s04、更新所有样本各自的方差和预测值;
11、s05、迭代次数加一,若迭代次数达到预设迭代次数,结束循环,将有标签样本集作为去噪样本集输出,否则回到步骤s02。
12、结合第一方面,进一步的,其特征在于,所述样本集中包含有标签样本和无标签样本。
13、结合第一方面,进一步的,在将所述样本集输入到构建好的回归预测主动学习框架中之前,还包括:删除所述样本集中的重复样本。
14、结合第一方面,进一步的,所述计算有标签样本集中噪声最大的有标签样本,通过以下公式进行:
15、
16、其中,xk是有标签样本集中噪声最大的有标签样本,∶=表示赋值,argmax表示argmax函数,表示前一次迭代的有标签样本集,|f(t-1)(xi)-yi|表示前一次迭代的学习器预测结果与实际标签的绝对差值,xi表示第i个有标签样本的特征值,yi表示xi对应的标签值。
17、结合第一方面,进一步的,所述计算无标签样本集中具有最大方差的无标签样本,通过以下公式进行:
18、
19、其中,xm是无标签样本集中具有最大方差的无标签样本,∶=表示赋值,argmax表示argmax函数,表示前一次迭代的无标签样本集,s(t-1)(xj)表示前一次迭代中无标签样本xj的方差。
20、结合第一方面,进一步的,所述对有标签样本集和无标签样本集的调整,通过以下公式进行:
21、
22、
23、其中,∶=表示赋值,xk是有标签样本集中噪声最大的有标签样本,yk是xk对应的标签值,表示学习器,表示当前迭代的有标签样本集,表示前一次迭代的有标签样本集,表示当前迭代的无标签样本集,表示前一次迭代的无标签样本集,xm是无标签样本集中具有最大方差的无标签样本。
24、第二方面,本专利技术还提供了一种基于回归预测主动学习框架的样本去噪装置,包括:
25、样本获取模块,被配置为:获取样本集;
26、样本去噪模块,被配置为:将所述样本集输入到构建好的回归预测主动学习框架中,得到去噪样本集,完成样本去噪。
27、第三方面,本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如第一方面任一项所述的基于回归预测主动学习框架的样本去噪方法。
28、第四方面,本专利技术还提供了一种设备,包括:
29、存储器,用于存储指令;
30、处理器,用于执行所述指令,使得所述设备执行实现如第一方面任一项所述的基于回归预测主动学习框架的样本去噪方法的操作。
31、与现有技术相比,本专利技术所达到的有益效果是:
32、本专利技术提供的一种基于回归预测主动学习框架的样本去噪方法、装置、存储介质及设备,提出了一种基于重标记的回归预测主动学习框架,该框架专注于处理带有标签噪声的标签样本,并通过重标记策略来提高模型的准确性,该框架通过在每次迭代中选择最有价值的样本进行标记,以减少样本标记的需求,并采用特定的重标记方法来处理标签噪声。通过这种方式,该框架能够在准确性和效率上取得平衡,构建更准确和鲁棒的回归预测模型,实现对有标签样本的去噪。
本文档来自技高网...【技术保护点】
1.一种基于回归预测主动学习框架的样本去噪方法,其特征在于,包括:
2.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,所述样本集中包含有标签样本和无标签样本。
3.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,在将所述样本集输入到构建好的回归预测主动学习框架中之前,还包括:删除所述样本集中的重复样本。
4.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,所述计算有标签样本集中噪声最大的有标签样本,通过以下公式进行:
5.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,所述计算无标签样本集中具有最大方差的无标签样本,通过以下公式进行:
6.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,所述对有标签样本集和无标签样本集的调整,通过以下公式进行:
7.一种基于回归预测主动学习框架的样本去噪装置,其特征在于,包括:
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计
9.一种设备,其特征在于,包括:
...【技术特征摘要】
1.一种基于回归预测主动学习框架的样本去噪方法,其特征在于,包括:
2.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,所述样本集中包含有标签样本和无标签样本。
3.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,在将所述样本集输入到构建好的回归预测主动学习框架中之前,还包括:删除所述样本集中的重复样本。
4.根据权利要求1所述的基于回归预测主动学习框架的样本去噪方法,其特征在于,所述计算有标签样本集中噪声最大的有标签样本,通过以下公式进行:
5.根据权利要求1所述的...
【专利技术属性】
技术研发人员:芮剑文,汪楠,樊涛,杨少奇,
申请(专利权)人:南京信息职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。