一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置制造方法及图纸

技术编号:35746340 阅读:12 留言:0更新日期:2022-11-26 18:50
本发明专利技术提供一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置,属于合金硬度预测领域。为解决现有技术对高熵合金硬度进行预测时往往因数据不足而进行数据扩充,其数据扩充方法无法保证生成数据的质量,不利于提高高熵合金的硬度预测准确度的问题。包括:步骤一、构建高熵合金物理特征与硬度的原始训练集;步骤二、构建GAN神经网络模型,对原始训练集特征进行扩充;步骤三、构建机器学习模型,将扩充特征数据集的特征生成标签,得到扩充训练集;步骤四、将扩充训练集与原始训练集构建合并训练集;步骤五、采用合并训练集对机器学习模型进行调参并训练,得到高熵合金硬度模型。通过本发明专利技术方法得到高熵合金硬度模型具有更高的准确性。具有更高的准确性。具有更高的准确性。

【技术实现步骤摘要】
一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置


[0001]本专利技术涉及合金硬度预测
,具体而言,涉及一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置。

技术介绍

[0002]高熵合金(High

entropy alloys,简称HEA)是一种新型合金,通常含有五种或五种以上摩尔分数为5%

35%的合金元素。由于其复杂而独特的组成结构,HEA中存在四种“核心效应”:高熵效应、晶格畸变效应、缓慢扩散效应和“鸡尾酒”效应。这些效应将导致各种优异的物理和机械性能,例如良好的耐磨性、良好的磁性、优异的低温断裂韧性和高硬度等。由于HEA的巨大组成空间和复杂的内部结构,机器学习非常适合于成分设计,并取得了一些进展。对于要实现的机器学习模型(machine

learning models,简称ML),数据的数量和质量越好,预测性能越强。但是由于高熵合金本身探索时间短,内部结构复杂,高熵合金的数据仍然比较少。可用数据的不足阻碍了高精度高熵合金硬度机器学习预测模型的构建。处理数据短缺问题的解决方案可分为三类。第一种是基于特征的,它通过扩展特征空间和选择最佳特征组合来提高ML模型的性能。但扩展相关物理特征需要专家的指导,通过对原始物理特征的简单算术运算生成特征缺乏明确的物理意义。第二种是迁移学习,它可以将从源域学习到的知识转移到目标域。然而,通常很难找到包含大量数据且接近目标域的合适源域。最后是数据扩充,它基于现有数据生成额外数据,例如过采样和合成少数过采样技术(SMOTE)。这是解决数据短缺的一种直接而很有潜力的方法,引起了许多研究人员的兴趣。然而,这些数据增强方法可能会改变数据的分布。Feng Yan等人提出了一种基于3sigma规则和余弦相似性的方法,该方法考虑了数据标签的分布,但忽略了特征的分布。因此,这些方法的性能往往不令人满意。
[0003]相反,生成对抗网络(GAN)是一种深度神经网络,可以有效地根据博弈论生成数据,并且可以使得生成的数据具有与真实数据相似的分布。到目前为止,GAN在材料科学中的应用主要是处理图像生成和分类问题。前者是一种无监督学习,通常由一般GAN求解;后者是一种具有离散标签的监督学习,可以由条件遗传算法(conditional GAN,CGAN)求解。对于具有连续标签的回归问题,GAN在材料科学方面的工作很少,多采用将特征和标签一起生成为生成样本,它将标签视为一个普通特征。因此,由GAN确定的特征和标签之间的关系是间接的、不令人满意的,并且不够准确;它可能会丢失一些标签信息,并进一步影响生成数据的质量。

技术实现思路

[0004]本专利技术要解决的技术问题是:
[0005]为了解决现有技术中在对高熵合金硬度进行预测时往往因数据不足而进行数据扩充,其数据扩充方法无法保证生成数据的质量,不利于提高高熵合金的硬度预测准确度
的问题。
[0006]本专利技术为解决上述技术问题所采用的技术方案:
[0007]本专利技术一方面,提出了一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法,包括如下步骤:
[0008]步骤一、收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;
[0009]步骤二、构建GAN神经网络模型,对原始训练集特征进行扩充;
[0010]将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;
[0011]步骤三、构建机器学习模型,将扩充特征数据集的特征生成标签;
[0012]首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;
[0013]步骤四、将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;
[0014]步骤五、将合并训练集输入至步骤三所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;
[0015]步骤六、将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。
[0016]进一步地,步骤一中所述高熵合金为Al

Co

Cr

Cu

Fe

Ni体系、Al

Co

Cr

Fe

Ni体系、Al

Co

Cr

Cu

Fe

体系、Al

Co

Cr

Fe

Ni体系、Al

Co

Cr

Cu

Fe体系、Al

Co

Cr

Fe

Ni体系、Al

Co

Cr

Cu

Fe

Ni体系和Co

Cr

Cu

Fe体系。
[0017]进一步地,步骤一中所述物理特征包括:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数
‑Ⅰ
e1/a、流动电子数
‑Ⅱ
e2/a和参数Ω、Λ、γ;
[0018]模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls

Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;
[0019]e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;
[0020]Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数。
[0021]进一步地,步骤二所述GAN神经网络模型结构包括:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,12本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法,其特征在于包括如下步骤:步骤一、收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;步骤二、构建GAN神经网络模型,对原始训练集特征进行扩充;将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;步骤三、构建机器学习模型,将扩充特征数据集的特征生成标签;首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;步骤四、将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;步骤五、将合并训练集输入至步骤三所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;步骤六、将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。2.根据权利要求1所述的方法,其特征在于:步骤一中所述高熵合金为Al

Co

Cr

Cu

Fe

Ni体系、Al

Co

Cr

Fe

Ni体系、Al

Co

Cr

Cu

Fe

体系、Al

Co

Cr

Fe

Ni体系、Al

Co

Cr

Cu

F e体系、Al

Co

Cr

Fe

Ni体系、Al

Co

Cr

Cu

Fe

Ni体系和Co

Cr

Cu

Fe体系。3.根据权利要求1所述的方法,其特征在于:步骤一中所述物理特征包括:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数
‑Ⅰ
e1/a、流动电子数
‑Ⅱ
e2/a和参数Ω、Λ、γ;模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls

Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数。4.根据权利要求1所述的方法,其特征在于:步骤二所述GAN神经网络模型结构包括:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,128,64,32,21;鉴别器共有1个输入层,2个隐藏层和1个输出层,其所包含的神经元个数分别为21,64,32,1;生成器和鉴别器的输出层分别采用tanh和sigmoid函数,隐藏层采用LeakyReLu;在每个隐藏层中使用批量归一化,在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整;训练时通过交替更新每个子网络的可训练参数,以对抗方式联合训练生成器和鉴别器网络。5.根据权利要求3所述的方法,其特征在于:步骤三中选择影响高熵合金硬度的最优特
征组合包括:参数γ、价电子浓度VEC、流动电子数

Ie1/a和构型熵ΔS。6.根据权利要求1所述的方法,其特征在于:步骤三中所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR

R。7.根据权利要求6所述的方法,其特征在于:步骤三中所述支持向量机回归模型SVR

R的调参方法采用贝叶斯调参,其对应的...

【专利技术属性】
技术研发人员:李述杨佳杨志远李帅刘东戎
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1