合金数据样本集的构建方法、装置及电子设备制造方法及图纸

技术编号:35425705 阅读:16 留言:0更新日期:2022-11-03 11:28
本申请提供了一种合金数据样本集的构建方法、装置及电子设备,方法包括:获取初始合金数据样本集;初始合金数据样本集中的样本包括合金制备策略及合金制备策略对应的合金性能;其中,合金制备策略包括:合金元素含量和热处理参数;对初始合金数据样本集中的样本进行数据清洗,得到第一中间数据样本集;对第一中间数据样本集中的样本进行特征筛选及特征添加,得到第二中间数据样本集;对第二中间数据样本集中的样本进行特征标准化处理,得到初始合金数据样本集对应的目标合金数据样本集。本申请能够满足多维特征合金模型的构建需求,有利于解决合金制备策略与性能之间复杂的非线性问题。题。题。

【技术实现步骤摘要】
合金数据样本集的构建方法、装置及电子设备


[0001]本申请涉及材料
,尤其是涉及一种合金数据样本集的构建方法、装置及电子设备。

技术介绍

[0002]随着时代的进步和航空技术的发展,现代工业对合金的性能提出了更高的要求。但是合金元素组元众多,且强化机制复杂多样。这就导致传统的实验试错方法变得耗时费力。如何发现新型的高性能合金仍然是一个重大问题。因此,计算方法对于合金材料的研究起到越来越重要的作用。而与传统的计算方法相比,机器学习方法具有其特殊的优势,能够快速地解决复杂的非线性关系,并且可以通过更换相关数据集,很容易地对机器学习模型进行相应的更新。
[0003]机器学习建模中极为关键的一点是,数据集的构建和特征的质量通常决定了一个机器学习模型的上限,而机器学习的相关预测算法只是尽可能地接近这个上限,由此说明数据集的构建是影响机器学习模型准确度的关键因素。
[0004]由于合金成分与力学性能之间复杂的非线性关系,机器学习在合金中的多特征建模仍然是一个关键问题,其中,数据集的合理构建是重中之重,是决定机器学习模型准确度的基础。此外,高强铝合金的性能始终受到热处理制度的影响,因此制定合适的特征提取策略对于构建合理的机器学习模型也起到至关重要的作用。但是,目前关于铝合金的机器学习建模应用主要还集中在合金成分的预测和单一性能的研究,因而其构建的样本集数据特征相对单一,无法满足多维特征合金模型的需求,不利于解决合金制备策略与性能之间复杂的非线性问题。

技术实现思路

[0005]本申请的目的在于提供一种合金数据样本集的构建方法、装置及电子设备,能够满足多维特征合金模型的构建需求,有利于解决合金制备策略与性能之间复杂的非线性问题。
[0006]第一方面,本申请实施例提供一种合金数据样本集的构建方法,方法包括:获取初始合金数据样本集;初始合金数据样本集中的样本包括合金制备策略及合金制备策略对应的合金性能;其中,合金制备策略包括:合金元素含量和热处理参数;对初始合金数据样本集中的样本进行数据清洗,得到第一中间数据样本集;对第一中间数据样本集中的样本进行特征筛选及特征添加,得到第二中间数据样本集;对第二中间数据样本集中的样本进行特征标准化处理,得到初始合金数据样本集对应的目标合金数据样本集。
[0007]在本申请较佳的实施方式中,上述获取初始合金数据样本集的步骤,包括:从关于铝合金的文献中筛选描述合金铸造工艺的目标文献;从目标文献中筛选包含合金制备策略与合金性能间对应关系的数据;基于包含合金制备策略与合金性能间对应关系的数据,建立初始合金数据样本集。
[0008]在本申请较佳的实施方式中,上述对初始合金数据样本集中的样本进行数据清洗,得到第一中间数据样本集的步骤,包括:从初始合金数据样本集中,提取出现次数达到次数阈值,且含量达到含量阈值的合金元素,提取同时存在固溶和时效的热处理参数,提取包括拉伸强度、屈服强度和伸长率中至少一个的合金性能;基于提取的合金元素及对应含量、热处理参数和合金性能,生成第一中间数据样本集。
[0009]在本申请较佳的实施方式中,上述对第一中间数据样本集中的样本进行特征筛选及特征添加,得到第二中间数据样本集的步骤,包括:获取影响合金力学性能的多个热力学特征;基于机器学习算法确定多个热力学特征分别对应的重要性参数;将最大的重要性参数对应的热力学特征确定为目标热力学特征;针对每个样本,确定样本在目标热力学特征下的特征值,并将特征值添加至样本中,得到第二中间数据样本集。
[0010]在本申请较佳的实施方式中,上述多个热力学特征包括:混合焓、混合熵、电负性、晶格畸变能、价电子浓度;目标热力学特征为原子尺寸差异特征。
[0011]在本申请较佳的实施方式中,上述确定样本在目标热力学特征下的特征值的步骤,包括:根据以下算式,计算样本在目标热力学特征下的特征值:
[0012][0013]其中,δr表示样本在原子尺寸差异特征下的特征值;c
i
和c
j
是样本中第i个元素和第j个元素分别对应的原子百分比,r
i
表示第i个元素的原子半径;n表示样本中元素的数量;表示样本中n个元素的平均原子半径。
[0014]在本申请较佳的实施方式中,上述对第二中间数据样本集中的样本进行特征标准化处理的步骤,包括:根据以下算式,对第二中间数据样本集中的样本进行特征标准化处理:
[0015]i=1,2,

,M;j=1,2,

,N;
[0016]其中,N表示样本的数量;M表示样本中特征的数量;表示第j个样本中的第i个特征进行标准化处理后的特征;表示第j个样本中的第i个特征的初始特征;μ
(i)
表示N个样本中第i个特征对应的平均值;σ
(i)
表示N个样本中第i个特征对应的标准偏差。
[0017]第二方面,本申请实施例还提供一种合金数据样本集的构建装置,装置包括:初始样本集获取模块,用于获取初始合金数据样本集;初始合金数据样本集中的样本包括合金制备策略及合金制备策略对应的合金性能;其中,合金制备策略包括:合金元素含量和热处理参数;数据清洗模块,用于对初始合金数据样本集中的样本进行数据清洗,得到第一中间数据样本集;特征筛选添加模块,用于对第一中间数据样本集中的样本进行特征筛选及特征添加,得到第二中间数据样本集;特征标准化模块,用于对第二中间数据样本集中的样本进行特征标准化处理,得到初始合金数据样本集对应的目标合金数据样本集。
[0018]第三方面,本申请实施例还提供一种电子设备,包括处理器和存储器,存储器存储
有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面所述的方法。
[0019]第四方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述第一方面所述的方法。
[0020]本申请实施例提供的合金数据样本集的构建方法、装置及电子设备中,首先获取初始合金数据样本集;该初始合金数据样本集中的样本包括合金制备策略及合金制备策略对应的合金性能;其中,合金制备策略包括:合金元素含量和热处理参数;然后对初始合金数据样本集中的样本进行数据清洗,得到第一中间数据样本集;然后对第一中间数据样本集中的样本进行特征筛选及特征添加,得到第二中间数据样本集;最后对第二中间数据样本集中的样本进行特征标准化处理,得到初始合金数据样本集对应的目标合金数据样本集。本申请实施例中通过对初始合金数据样本集进行数据清洗、特征筛选、特征添加以及特征标准化处理,得到能够满足多维特征合金模型的构建需求的目标合金数据样本集。
附图说明
[0021]为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合金数据样本集的构建方法,其特征在于,所述方法包括:获取初始合金数据样本集;所述初始合金数据样本集中的样本包括合金制备策略及所述合金制备策略对应的合金性能;其中,所述合金制备策略包括:合金元素含量和热处理参数;对所述初始合金数据样本集中的样本进行数据清洗,得到第一中间数据样本集;对所述第一中间数据样本集中的样本进行特征筛选及特征添加,得到第二中间数据样本集;对所述第二中间数据样本集中的样本进行特征标准化处理,得到所述初始合金数据样本集对应的目标合金数据样本集。2.根据权利要求1所述的方法,其特征在于,获取初始合金数据样本集的步骤,包括:从关于铝合金的文献中筛选描述合金铸造工艺的目标文献;从所述目标文献中筛选包含合金制备策略与合金性能间对应关系的数据;基于包含合金制备策略与合金性能间对应关系的数据,建立初始合金数据样本集。3.根据权利要求1所述的方法,其特征在于,对所述初始合金数据样本集中的样本进行数据清洗,得到第一中间数据样本集的步骤,包括:从所述初始合金数据样本集中,提取出现次数达到次数阈值,且含量达到含量阈值的合金元素,提取同时存在固溶和时效的热处理参数,提取包括拉伸强度、屈服强度和伸长率中至少一个的合金性能;基于提取的合金元素及对应含量、热处理参数和合金性能,生成第一中间数据样本集。4.根据权利要求1所述的方法,其特征在于,对所述第一中间数据样本集中的样本进行特征筛选及特征添加,得到第二中间数据样本集的步骤,包括:获取影响合金力学性能的多个热力学特征;基于机器学习算法确定多个所述热力学特征分别对应的重要性参数;将最大的重要性参数对应的热力学特征确定为目标热力学特征;针对每个样本,确定所述样本在所述目标热力学特征下的特征值,并将所述特征值添加至所述样本中,得到所述第二中间数据样本集。5.根据权利要求4所述的方法,其特征在于,所述多个热力学特征包括:混合焓、混合熵、电负性、晶格畸变能、价电子浓度;所述目标热力学特征为原子尺寸差异特征。6.根据权利要求5所述的方法,其特征在于,确定所述样本在所述目标热力学特征下的特征值的步骤,...

【专利技术属性】
技术研发人员:隽永飞牛国帅张佼戴永兵姜海涛杨健孙宝德
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1