一种玻璃膨胀系数数据处理过程及其计算方法技术

技术编号：40338532 阅读：32 留言：0更新日期：2024-02-09 14:27

本发明专利技术公开了一种玻璃膨胀系数数据处理过程及其计算方法，包括：采集玻璃膨胀系数数据，构建初始的玻璃膨胀系数数据集，该数据集的每个样本包括玻璃配比和对应的膨胀系数；对玻璃膨胀系数数据集中的数据分布进行平衡；对玻璃膨胀系数数据集中的高维数据进行降维，并删除离群样本；按照预设标准删除玻璃配比相同但膨胀系数不相同的样本；对玻璃膨胀系数数据集进行数据扩充；利用上述步骤处理之后的玻璃膨胀系数数据集对随机森林模型进行训练，获得训练好的玻璃膨胀系数模型；针对待预测的玻璃材料，利用所述玻璃膨胀系数模型预测其膨胀系数。本发明专利技术可以显著提高玻璃膨胀系数模型的精度，对高性能玻璃纤维的研发有着重要意义。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于玻璃数据处理及性能预测领域，特别是一种玻璃膨胀系数数据处理过程及其计算方法。

技术介绍

1、玻璃膨胀系数是指玻璃在温度变化时，其体积或长度发生的相对变化量。玻璃膨胀系数在工程设计和应用中具有重要的意义，是玻璃性能的重要指标之一，如不同成分的玻璃的焊接或熔接、迭层套料玻璃的制造，都要求具有近似的热胀系数，电真空玻璃需将玻璃和金属熔封，也要考虑其膨胀系数。玻璃膨胀系数过大，会导致玻璃在加工或使用过程中产生内应力，从而破裂和变形。低膨胀玻璃的应用场景非常广泛，如光纤通信的光纤、太阳能电池板的覆盖层、精密仪器的部件等；高膨胀玻璃可以用于温度传感器、热释放装置和密封材料等。因此，根据玻璃不同的用途和要求，提前预测并选择合适的玻璃膨胀系数具有重要意义。

2、然而，玻璃膨胀系数的测定过程中需要同时考虑测试温度范围的选择、测试样品的制备和保存和测试仪器的校准和操作等方面，同时测试数据应进行必要的平滑、拟合、修正等处理，以消除噪声和异常值的影响，从而得出准确和可靠的膨胀系数值。现实中测得的玻璃膨胀系数往往质量较差，所得到的数据集都会存在以下问题：数据集中数据的来源不统一，膨胀系数的测试标准也不一致，导致会出现配比相同但是膨胀系数不相同的样本；数据集中玻璃配比的分布有一定离散性；数据集中玻璃的膨胀系数会出现分布不平衡的情况；同时由于新配方研发难度大、玻璃测试成本较高等原因，导致玻璃膨胀系数数据集的数据量过小。

3、对于热膨胀系数数据集中配比相同但是膨胀系数不相同的样本，传统方法往往是直接删除所有相同情况的样本，

技术实现思路

1、本专利技术的目的在于针对上述现有技术玻璃膨胀系数数处理存在的缺陷或者不足，提供一种玻璃膨胀系数数据处理过程及其计算方法，可以提高玻璃膨胀系数模型的精度，对高性能玻璃纤维的研发有着重要意义。

2、实现本专利技术目的的技术解决方案为：一方面，提供了一种玻璃膨胀系数数据处理过程及其计算方法，所述方法包括：步骤1，采集玻璃膨胀系数数据，构建初始的玻璃膨胀系数数据集，该数据集的每个样本包括玻璃配比和对应的膨胀系数；

3、步骤2，对玻璃膨胀系数数据集中的数据分布进行平衡；

4、步骤3，对玻璃膨胀系数数据集中的高维数据进行降维，并删除离群样本；

5、步骤4，按照预设标准删除玻璃配比相同但膨胀系数不相同的样本；

6、步骤5，利用上述步骤处理之后的玻璃膨胀系数数据集对随机森林模型进行训练，获得训练好的玻璃膨胀系数模型；

7、步骤6，针对待预测的玻璃材料，利用所述玻璃膨胀系数模型预测其膨胀系数。

8、进一步地，步骤2采用改进的标签分布平滑法即lds法对数据分布进行平衡，具体包括：

9、步骤2-1，通过核密度估计，将经验标签密度分布p(y)与对称核函数k(y,y')卷积，得到有效标签密度分布

10、

11、其中，y为膨胀系数值；

12、步骤2-2，通过对有效标签密度分布的倒数与实际值进行加权得到平衡后的值。

13、进一步地，步骤3中通过多维尺度变换算法即mds算法对高维数据进行降维，所述mds算法的基本思想是最小化高维空间和低维空间中的距离矩阵之间的差异，该差异表示为损失函数l(y,z)：

14、

15、其中，y是高维空间中的数据矩阵，z是低维空间中的数据矩阵，dij是y中第i个和第j个数据点之间的距离，是z中第i个和第j个数据点之间的距离，zi是z中第i个点，λ是正则化参数，n是数据集中样本个数；

16、通过梯度下降法算法获得使l(y,z)达到最小值的最优矩阵z，求解所述损失函数。

17、进一步地，步骤4所述按照预设标准删除玻璃配比相同但膨胀系数不相同的样本，具体包括：

18、计算分布差δz：

19、

20、其中，y为膨胀系数值，ymax和ymin分别表示配比相同但膨胀系数不相同的所有样本中最大的膨胀系数和最小的膨胀系数，μ和σ分别为玻璃膨胀系数数据集中膨胀系数的均值和标准差；

21、若δz>p％，则删除所有配比相同但膨胀系数不相同的样本，反之保留该配比对应的样本；p％为预设阈值。

22、进一步地，所述保留该配比对应的样本，具体包括：保留该配比，并将对应的膨胀系数修正为所有样本的平均值。

23、进一步地，步骤5具体包括：

24、步骤5-1，将玻璃膨胀系数数据集按7：3分为训练集和测试集；

25、步骤5-2，利用随机森林模型对所述训练集进行训练，获得训练好的玻璃膨胀系数模型；

26、步骤5-3，利用所述玻璃膨胀系数模型对测试集中的玻璃配方的膨胀系数进行预测；

27、步骤5-4，计算预测值和真实值之间的rmse：

28、

29、其中，ntest为测试集中样本数量，为测试集中第b个样本的膨胀系数真实值，为第b个样本的膨胀系数的预测值。

30、进一步地，所述方法还包括：

31、在步骤4之后执行：对玻璃膨胀系数数据集进行数据扩充。

32、进一步地，通过修正插值法对玻璃膨胀系数数据集进行扩充，获得新的样本值ynew为：

33、

34、其中，

35、

36、

37、其中，第δi+1、δi、δi-1、δi-2分别为第i+1个、第i个、第i-1个、第i-2个样本点处的斜率。

38、另一方面，提供了一种玻璃膨胀系数数据处理过程及其计算系统，所述系统包括顺次执行的：

39、第一模块，用于采集玻璃材料膨胀系数数据，构建初始的玻璃膨胀系数数据集，该数据集的每个样本包括玻璃配比和对应的膨胀系数；

40、第二模块，用于对玻璃膨胀系数数据集中的数据分布进行平衡；

41、第三模块，用于对玻璃膨胀系数数据集中的高维数据进行降维，并删除离群样本；

42、第四模块，用于按照预设标准删除玻璃配比相同但膨胀系数不相同的样本；

43、第五模块，用于利用上述模块处理之后的玻璃膨胀系数数据集对随机森林模型进行训练，获得训练好的玻璃膨胀系数模型；

44、第六模块，针对待预测的玻璃材料，利用所述玻璃膨胀系数模型预测其膨胀系数。

45、进一步地，所述系统还包括：

46、在第四模块之后执行的：

47、第七模块，用于对玻璃膨胀系数数据集进行扩充。

48、本专利技术与现有技术相比，其显著优点为：

49、(1)针对当数据集中出现配比相同但是膨胀系数不相同的样本时所采用的方法，相对传统的直接删除法或者直接本文档来自技高网...

【技术保护点】

1.一种玻璃膨胀系数数据处理过程及其计算方法，其特征在于，所述方法包括：

2.根据权利要求1所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，步骤2采用改进的标签分布平滑法即LDS法对数据分布进行平衡，具体包括：

3.根据权利要求1所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，步骤3中通过多维尺度变换算法即MDS算法对高维数据进行降维，所述MDS算法的基本思想是最小化高维空间和低维空间中的距离矩阵之间的差异，该差异表示为损失函数L(Y,Z)：

4.根据权利要求1所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，步骤4所述按照预设标准删除玻璃配比相同但膨胀系数不相同的样本，具体包括：

5.根据权利要求4所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，所述保留该配比对应的样本，具体包括：保留该配比，并将对应的膨胀系数修正为所有样本的平均值。

6.根据权利要求1所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，步骤5具体包括：

7.根据权利要求1所述的玻璃膨胀系数数据处理过程及其

8.根据权利要求7所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，通过修正插值法对玻璃膨胀系数数据集进行扩充，获得新的样本值ynew为：

9.基于权利要求1至8任意一项所述方法的玻璃膨胀系数数据处理过程及其计算系统，其特征在于，所述系统包括顺次执行的：

10.根据权利要求9所述的玻璃膨胀系数数据处理过程及其计算系统，其特征在于，所述系统还包括：

...

【技术特征摘要】

1.一种玻璃膨胀系数数据处理过程及其计算方法，其特征在于，所述方法包括：

2.根据权利要求1所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，步骤2采用改进的标签分布平滑法即lds法对数据分布进行平衡，具体包括：

3.根据权利要求1所述的玻璃膨胀系数数据处理过程及其计算方法，其特征在于，步骤3中通过多维尺度变换算法即mds算法对高维数据进行降维，所述mds算法的基本思想是最小化高维空间和低维空间中的距离矩阵之间的差异，该差异表示为损失函数l(y,z)：

5.根据权利要求4所述的玻璃膨胀系数数据处理过程及其...

【专利技术属性】
技术研发人员：刘鑫，赵明，郎玉冬，赵子煜，陈阳，赵谦，
申请(专利权)人：南京玻璃纤维研究设计院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人