基于机器学习聚类算法的材质结构归类方法及系统技术方案

技术编号:33528939 阅读:18 留言:0更新日期:2022-05-19 01:55
本发明专利技术提供了基于机器学习聚类算法的材质结构归类方法及系统,步骤如下:建立数据集:征集多层复合膜的材质结构样本数据,并获取样本数据的离散型维度特征以及连续型维度特征;特征预处理:对特征值进行标准化处理;通过聚类算法对特征预处理后的数据集进行聚类分析,然后进行建模,以模型输出的聚类结果对模型进行评估,得到最优聚类算法;输出基于所述最优聚类算法得到的模型的聚类结果,根据该聚类结果统计材质结构被归入各类别的数据量占该材质结构总数据量的百分比,选取占比最大的类别作为归类结果。本发明专利技术根据人工智能技术来对复合膜维度特征进行分析,通过处理样本数据的5个维度特征,实现了对各种材质结构的精确归类。类。类。

【技术实现步骤摘要】
基于机器学习聚类算法的材质结构归类方法及系统


[0001]本专利技术涉及材料类产品标准制定过程中的材质结构归类
,具体而言,涉及一种基于机器学习聚类算法的材质结构归类方法及系统。

技术介绍

[0002]在材料类产品标准的制定过程中,往往需要对标准范围内的一系列产品的材质结构进行归类,并对不同材质结构的产品规定不同的技术参数要求。为了使产品标准能覆盖更广泛的材质结构种类,并使每一材质结构的技术要求参数能更准确的判定产品的合格程度,在标准制定初期对标准范围内的一系列产品材质结构进行精确归类尤为重要。优秀的材质结构归类能够使各类别产品材质结构的界限清晰明确,并使同一类产品材质结构具备尽可能多的相同特征,便于后期技术参数要求的设定。
[0003]多层复合膜,是由两层或多层不同材料的薄膜复合而成的高分子材料,主要用于包装,由于材质结构的不同,其两两组合、三三组合后品种繁多,因此对其进行有效归类尤为重要。
[0004]目前材料类产品标准制定过程中的材质结构归类往往是依据该产品约定俗成的划分,或依靠标准起草者的经验进行材质结构类别划分,或通过产品的少数几个特征维度的数据分析进行划分。传统的数据分析方法基本无法直接处理三个维度以上的特征归类,并且在归类后也无法通过适用的方法来评估材质结构归类的准确性,且依赖标准起草者的经验或人工分析各种材质结构的特征数据往往耗时较长,效率低下。

技术实现思路

[0005]本专利技术的目的在于提供基于机器学习聚类算法的材质结构归类方法及系统,旨在解决
技术介绍
中所指出的问题。
[0006]本专利技术的实施例通过以下技术方案实现:基于机器学习聚类算法的材质结构归类方法,包括以下步骤:
[0007]A、建立数据集:征集多层复合膜的材质结构样本数据,并获取样本数据的离散型维度特征以及连续型维度特征,所述离散型维度特征包括材质结构,所述连续型维度特征包括韧性向的拉断力、刚性向的拉断力、韧性向的断裂标称应变以及刚性向的断裂标称应变;
[0008]B、特征预处理:基于各连续型维度特征的样本数据均值以及样本数据标准差,分别对特征值进行标准化处理;
[0009]C、通过聚类算法对特征预处理后的数据集进行聚类分析,然后进行建模,以模型输出的聚类结果的轮廓系数、CH指标以及运算时间对模型进行评估,得到最优聚类算法;
[0010]D、输出基于所述最优聚类算法得到的模型的聚类结果,根据输出的聚类结果统计材质结构被归入各类别的数据量占该材质结构总数据量的百分比,选取每个材质结构中数据量占比最大的类别作为该材质结构的归类结果。
[0011]进一步地,所述特征预处理步骤具体包括:
[0012]采用Z

Score归一法,利用样本数据均值以及样本数据标准差进行标准化处理,表达式如下:
[0013][0014]上式中,X

为标准化后的特征值,X为原始特征值,为该特征的样本数据均值,σ为该特征的样本数据标准差。
[0015]进一步地,所述聚类算法包括K

means、均值漂移、层次聚类、密度聚类、BIRCH或谱聚类算法中的两种或两种以上。
[0016]进一步地,所述轮廓系数的表达式如下:
[0017][0018]上式中,S(i)表示第i个样本点的轮廓系数,a(i)表示第i个样本点的内聚度,b(i)表示第i个样本点的分离度;
[0019]CH指标的表达式如下:
[0020][0021]上式中,S(k)表示第k类的CH指标,B
K
表示类间距离,W
K
表示类内距离,K表示总类别数。
[0022]进一步地,所述步骤C中以模型输出的聚类结果的轮廓系数、CH指标以及运算时间对模型进行评估,得到最优聚类算法具体包括:
[0023]对比各聚类算法的轮廓系数,取轮廓系数最接近1的算法为最优算法;
[0024]若两种或多种算法的轮廓系数相同且均最接近1,则对比相同轮廓系数算法的CH指标,取CH指标最大的算法为最优算法;
[0025]若两种或多种算法的CH指标相同且均为最大,则对比相同CH指标算法的运算时间,取运算时间最短的算法为最优算法。
[0026]进一步地,所述方法还包括:根据材质结构归类结果,将四个连续型维度特征两两对应,形成散点图验证归类结果各大类的特征相关性。
[0027]本专利技术还提供基于机器学习聚类算法的材质结构归类系统,应用到如上述所述的方法,包括:
[0028]数据集构建模块,用于征集多层复合膜的材质结构样本数据,并获取样本数据的离散型维度特征以及连续型维度特征,所述离散型维度特征包括材质结构,所述连续型维度特征包括韧性向的拉断力、刚性向的拉断力、韧性向的断裂标称应变以及刚性向的断裂标称应变;
[0029]特征预处理模块,用于基于各连续型维度特征的样本数据均值以及样本数据标准差,分别对特征值进行标准化处理;
[0030]聚类模块,用于通过聚类算法对特征预处理后的数据集进行聚类分析,然后进行建模,以模型输出的聚类结果的轮廓系数、CH指标以及运算时间对模型进行评估,得到最优
聚类算法;
[0031]输出模块,用于输出基于所述最优聚类算法得到的模型的聚类结果;
[0032]统计模块,用于根据输出的聚类结果统计材质结构被归入各类别的数据量占该材质结构总数据量的百分比;
[0033]归类模块,用于选取每个材质结构中数据量占比最大的类别作为该材质结构的归类结果。
[0034]本专利技术会提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的方法。
[0035]本专利技术实施例的技术方案至少具有如下优点和有益效果:本专利技术通过对特征进行标准化预处理,使不同的特征均转化为了均值为0,标准差为1的无量纲数据集,从而减小了收敛的复杂度,节省了运算时间;相比传统的依赖标准起草者的经验或人工分析各材质结构的特征数据并形成归类,本专利技术实用机器学习聚类算法对数据进行归类,全程无需人工干扰,节省了人力成本,大大提高了归类的严谨性、准确性和效率;通过轮廓系数、CH指标和运算时间来评价材质结构归类的准确性和效率,使归类的精度能够实现实时的量化和选优;且本材质结构归类方法实现过程中,通过处理样本数据的离散型维度特征以及连续型维度特征共5个维度特征的特征归纳,数据特征划分出的机械性能归类结果符合高分子材料基本原理,实现了对各种材质结构的精确归类;在对特征预处理后的数据集进行聚类分析过程中采用K

means、均值漂移、层次聚类、密度聚类、BIRCH、谱聚类中至少两种或两种以上算法进行对比,可实现针对不同样本集优选准确性最高的聚类算法。
附图说明
[0036]图1为本专利技术实施例1提供的材质结构归类方法流程示意图;
[0037]图2为本专利技术实施例1提供的复合膜袋各种材质结构的特征相关性分布本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于机器学习聚类算法的材质结构归类方法,其特征在于,包括以下步骤:A、建立数据集:征集多层复合膜的材质结构样本数据,并获取样本数据的离散型维度特征以及连续型维度特征,所述离散型维度特征包括材质结构,所述连续型维度特征包括韧性向的拉断力、刚性向的拉断力、韧性向的断裂标称应变以及刚性向的断裂标称应变;B、特征预处理:基于各连续型维度特征的样本数据均值以及样本数据标准差,分别对特征值进行标准化处理;C、通过聚类算法对特征预处理后的数据集进行聚类分析,然后进行建模,以模型输出的聚类结果的轮廓系数、CH指标以及运算时间对模型进行评估,得到最优聚类算法;D、输出基于所述最优聚类算法得到的模型的聚类结果,根据输出的聚类结果统计材质结构被归入各类别的数据量占该材质结构总数据量的百分比,选取每个材质结构中数据量占比最大的类别作为该材质结构的归类结果。2.如权利要求1所述的基于机器学习聚类算法的材质结构归类方法,其特征在于,所述特征预处理步骤具体包括:采用Z

Score归一法,利用样本数据均值以及样本数据标准差进行标准化处理,表达式如下:上式中,X

为标准化后的特征值,X为原始特征值,为该特征的样本数据均值,σ为该特征的样本数据标准差。3.如权利要求1所述的基于机器学习聚类算法的材质结构归类方法,其特征在于,所述聚类算法包括K

means、均值漂移、层次聚类、密度聚类、BIRCH或谱聚类算法中的两种或两种以上。4.如权利要求1所述的基于机器学习聚类算法的材质结构归类方法,其特征在于,所述轮廓系数的表达式如下:上式中,S(i)表示第i个样本点的轮廓系数,a(i)表示第i个样本点的内聚度,b(i)表示第i个样本点的分离度;CH指标的表达式如下:上式中,S(k)表示第k类的CH指标,B
K
表示类间距离,W
K
表示类内距离,K表示总...

【专利技术属性】
技术研发人员:赵文隆周晓群周良春马俊辉张晓飞
申请(专利权)人:成都产品质量检验研究院有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1