一种大数据背景下的切削数据综合应用方法技术

技术编号:21060039 阅读:19 留言:0更新日期:2019-05-08 06:53
本发明专利技术属于信息检索及其数据库结构技术领域,公开了一种大数据背景下的切削数据综合应用方法,通过数据优选和数据挖掘算法对多源异构数据进行分析,通过历史加工实例建立多目标要求下的切削参数选用方法。针对高强度钢材料加工过程中切削力大、切削温度高、刀具磨损严重等问题,通过熵权逼近理想排序,设置主观与客观标准对其进行评价,并从中优选符合加工需求的最优参数;针对高强度钢材料加工完成的表面质量不易控制、无法建立多因素数理模型的问题,使用聚类分析与关联规则对切削参数的选取方法进行挖掘,形成切削用量选用规则以供后续规则推理使用;通过逼近理想排序法与决策树分类发将参数评价寻优与数据挖掘进行结合。

A Comprehensive Application Method of Cutting Data in the Background of Large Data

【技术实现步骤摘要】
一种大数据背景下的切削数据综合应用方法
本专利技术属于信息检索及其数据库结构
,尤其涉及一种大数据背景下的切削数据综合应用方法。
技术介绍
目前,业内常用的现有技术是这样的:针对切削数据的复杂性和多样性特点,其综合应用是实现大数据制造的必由之路,也是数据服务系统开发的前沿方向和应用难点。参数寻优是数据综合应用的重要方向,在切削数据分析中有着广泛应用。传统的切削参数优化方法有遗传算法、蚁群算法、粒子群算法、模拟退火算法等,例如,遗传算法,以最小加工成本为目标进行工艺参数进行优化;刘海江等使用粒子群算法,以最大生产率和最低生产成本为目标完成切削用量优化;混合使用免疫算法和爬山算法,以最大利润率为目标实现切削参数优化。以上数据优化方法基于线性规划思想,本质是以目标函数为导向通过搜索迭代求最优解,有着较强的数学基础,但是实际应用需要首先对参数分别进行精确建模,因而在大规模、高维度、相互耦合的数据分析中不适用,更有针对性、更为直接的寻优方法成为参数优选的研究方向。例如,通过整合质量控制和质量管理的信息,建立质量寻优智能质量评价和知识发现系统;张明树等提出基于图论和模糊逼近理想排序法的高速切削工艺参数优化方法,可以自适应地构建工艺实例过滤集。以上实例应用加工生产获取的数据规律对加工参数提供评价和寻优,不需要考虑复杂数学建模问题,同时可以与大数据背景较好结合,具有更强的实用性。而在大数据技术迅速发展的背景下,数据挖掘成为提高现场数据使用效率和发现隐含知识的重要方法,可以较好适应切削数据因素复杂且难以精确建模的特点。目前数据挖掘方法在切削加工领域的研究处于起步阶段,其中的典型实例为,基于粗糙集数据挖掘理论,提出一种用于刀具制备的快速工艺控制方法;基于K平均聚类算法,提出一种刀具状态和表面粗糙度评价的方法;使用最小支持向量机理论对高速切削温度进行分析,实现切削温度的预测和优化;通过应用权重和分类算法,完成工艺参数影响因素的分析和建模;通过定义装配过程中节点的支持度,给出装配工艺挖掘规则。以上方法是数据挖掘在切削加工领域的应用,通过历史大数据的训练实现了数据分类、聚类、规则与预测等功能,主要用于工艺参数、加工表面粗糙度和装配工艺数据的分析处理,无法针对难加工材料加工刀具磨损严重、加工表面质量低的问题,基于大数据环境下的多源异构切削数据进行加工过程参数的评价和工艺知识的挖掘。综上所述,现有技术存在的问题是:由于系统数据的多源异构特性,难以形成统一的数学表征模型和应用方法体系,大量历史数据包含潜在价值却无法得到有效应用。解决上述技术问题的难度:难度:未来数据挖掘的研究方向是与知识获取、数据可视化、机器学习等方法的结合,具有较强的复杂性,不仅涉及众多的算法,还要通过提取转化形成服务知识。意义:通过逼近理想排序法与决策树分类发将参数评价寻优与数据挖掘进行结合,探寻其在加工质量控制方面的综合应用,具有重要意义。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种大数据背景下的切削数据综合应用方法。本专利技术是这样实现的,一种大数据背景下的切削数据综合应用方法,所述大数据背景下的切削数据综合应用方法通过数据优选和数据挖掘算法对多源异构数据进行分析;通过熵权逼近理想排序,设置主观与客观标准对其进行评价,并从中优选符合加工需求的最优参数;使用聚类分析与关联规则对切削参数的选取方法进行挖掘,形成切削用量选用规则以供后续规则推理使用。进一步,所述大数据背景下的切削数据综合应用方法包括以下步骤:步骤一,通过熵权逼近理想排序,设置主观与客观标准对其进行评价,并从中优选符合加工需求的最优参数;步骤二,使用聚类分析与关联规则对切削参数的选取方法进行挖掘,形成切削用量选用规则以供后续规则推理使用;步骤三,通过逼近理想排序法与决策树分类发将参数评价寻优与数据挖掘进行结合,在加工质量控制方面的综合应用。针对切削速度、进给量、切削深度要素,选取切削力、切削时前刀面温度、表面粗糙度值、加工单位材料所需时间、刀具耐用度为质量指标,采用熵权逼近理想排序分析进行切削参数评价,避免人为因素对分析排序的干扰;针对切削加工表面质量数据存在不完整性和随机性的特点,借助聚类算法和关联算法挖掘多因素耦合下的切削参数之间的潜在规律,从直观经验和定量关系形成多切削参数的分析应用方法,为切削参数的规则推理提供方案;针对切削加工实际应用,通过分类训练、权重排序获得加工表面质量的分析决策树,为切削用量的选择提供直观准确的效果预测。进一步,所述熵权逼近理想排序方法具体包括:矩阵形式为:其中A1,A2,...,An为切削加工的所有备选方案,C1,C2,...,Cm为问题的评价指标;①计算标准化后的决策矩阵R={rij}n×m中各元素的数值rij,分别按照公式(2)和(3)对收益型指标和成本型指标进行归一化:其中rij称为第i个被评价参数在第j个指标之上的标准化值,0≤rij≤1;②构建加权的标准化决策矩阵V={vij}n×m:其中wj为第j项评价指标的权重系数,且满足各项指标的权重系数之和为1;选择信息熵作为变量不确定度的评价指标;变量的不确定性越大时信息熵也就越大,衡量数据所需要的信息量也就越大;熵权可为客观评价系统中各项指标的权重系数计算提供理论依据,取值按照下列公式计算:其中的参数为:求得各项指标的权重系数wj;③确定正理想解S+和负理想解S-:S+=(v1+,v2+,…,vm+);S-=(v1-,v2-,…,vm-);其中的参数为:vj+=maxi{vij};vj-=mini{vij};④计算每个样本到正负理想点的距离:⑤计算每组备选方案的贴近度CCi:进一步,所述聚类分析方法具体包括:给定n个数据点X={x1,x2,x3,...,xn},通过模糊分类矩阵U=[uij]m×n,找到m个聚类中心V={v1,v2,v3,...,vm},使得每个数据点xi相对聚类中心vi的隶属度uij最小,且满足总和为一;分类矩阵的目标函数表达式为:其中k为模糊加权指数,取k=2;dij为数据点到聚类中心的欧氏距离,且有:dij=||xj-vi||=(xj-vi)T(xj-vi);根据目标函数表达式的几何意义,FCM算法的核心即为求取目标函数最小时分类矩阵与迭代中心;计算步骤如下:①确定聚类中心个数n和模糊加权指数k,对分类矩阵U进行初始化,并进行第0次迭代;②计算所有样本的聚类中心:③更新分类矩阵:④对于给定精度σ>0,满足||U1+1-U1||<σ时终止运算,否则增加迭代次数为l=1+1并重复迭代直到结果满足精度要求。进一步,所述关联分析方法具体包括:利用已知的(k-1)维频繁项目集来生成k维频繁项目集,通过对数据库的多次扫描来发现所有的频繁项目集;支持度Support和置信度Confidence是关联规则的关键参数,定义分别为:维数增加重复该过程,直到生成M维频繁项集。进一步,所述决策树分析方法具体包括:①对数据集进行离散化,计算集合属性的信息增益率,以集合中信息增益率最大的属性作为根节点分枝属性,信息熵和信息增益率的计算公式分别为:其中p(i|S)为第i类在S集合中占的比例,maxS表示规则数目,Entropy(S)反映了信息数量程度;Val(F)表示属性的所有不同取值,Sv是规则集本文档来自技高网
...

【技术保护点】
1.一种大数据背景下的切削数据综合应用方法,其特征在于,所述大数据背景下的切削数据综合应用方法通过数据优选和数据挖掘算法对多源异构数据进行分析;通过熵权逼近理想排序,选取符合加工需求的最优参数;使用聚类分析与关联规则对切削参数的选取方法进行挖掘,形成切削用量选用规则。

【技术特征摘要】
1.一种大数据背景下的切削数据综合应用方法,其特征在于,所述大数据背景下的切削数据综合应用方法通过数据优选和数据挖掘算法对多源异构数据进行分析;通过熵权逼近理想排序,选取符合加工需求的最优参数;使用聚类分析与关联规则对切削参数的选取方法进行挖掘,形成切削用量选用规则。2.如权利要求1所述的大数据背景下的切削数据综合应用方法,其特征在于,所述大数据背景下的切削数据综合应用方法包括以下步骤:步骤一,通过熵权逼近理想排序,优选符合加工需求的最优参数;步骤二,使用聚类分析与关联规则对切削参数的选取方法进行挖掘,形成切削用量选用规则以供后续规则推理使用;步骤三,通过逼近理想排序法与决策树分类发将参数评价寻优与数据挖掘进行结合,在加工质量控制方面的综合应用。3.如权利要求2所述的大数据背景下的切削数据综合应用方法,其特征在于,所述熵权逼近理想排序方法具体包括:矩阵形式为:其中A1,A2,...,An为切削加工的所有备选方案,C1,C2,...,Cm为问题的评价指标;①计算标准化后的决策矩阵R={rij}n×m中各元素的数值rij,分别按照公式(2)和(3)对收益型指标和成本型指标进行归一化:其中rij称为第i个被评价参数在第j个指标之上的标准化值,0≤rij≤1;②构建加权的标准化决策矩阵V={vij}n×m:其中wj为第j项评价指标的权重系数,且满足各项指标的权重系数之和为1;选择信息熵作为变量不确定度的评价指标;变量的不确定性越大时信息熵也就越大,衡量数据所需要的信息量也就越大;熵权可为客观评价系统中各项指标的权重系数计算提供理论依据,取值按照下列公式计算:其中的参数为:求得各项指标的权重系数wj;③确定正理想解S+和负理想解S-:S+=(v1+,v2+,…,vm+);S-=(v1-,v2-,…,vm-);其中的参数为:vj+=maXi{vij};vj-=mini{vij};④计算每个样本到正负理想点的距离:⑤计算每组备选方案的贴近度CCi:4.如权利要求2所述的大数据背景下的切削数据综合应用方法,其特征在于,所述聚类分析方法具体包括:给定n个数据点X={x...

【专利技术属性】
技术研发人员:焦黎王昭王西彬颜培陈刚史雪春刘志兵解丽静梁志强周天丰
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1