一种基于大数据分析的航天产品装配质量问题分类方法技术

技术编号:14526624 阅读:102 留言:0更新日期:2017-02-02 06:15
本发明专利技术公开了一种基于大数据分析的航天产品装配质量问题分类方法,基于Hadoop构建大数据分析平台,首先构建初始SVM模型,然后运用遗传算法对初始SVM模型的参数进行优化选择,获得最佳分类精度SVM模型的参数;最终得到GA‑SVM模型。该GA‑SVM模型可以将不同的质量问题进行分类,而且具有很高的分类精度。本发明专利技术运用了大数据分析技术,使得运算更为高效,遗传算法中的交叉运算和变异运算考虑到种群进化的动态性,能够快速准确的找到最优解,将遗传算法应用到支持向量机的参数优化中,提高了质量问题分类的精度。

【技术实现步骤摘要】

本专利技术属于质量管理和数据挖掘的交叉领域,尤其涉及一种基于大数据分析的航天产品装配质量问题分类方法。
技术介绍
所谓“航天产品装配质量问题”,是指航天产品在装配过程中,出现的各种各样的质量问题,导致质量问题的原因错综复杂,不同的质量问题,它的影响因素也不一样,而且影响因素之间也会有关联,往往很难确定质量问题产生的根源和造成质量问题的影响因素。所谓“航天产品装配质量问题分类”,就是快速准确地对装配过程中出现的故障、质量问题进行分析和诊断,确定质量问题的性质、类别和部位。随着企业的智能化、信息化,企业会运用传感器、PLC、监控设备、数字化测量设备、MES生产作业模块、扫描设备等手段进行全面数据采集,比如装配过程中的仓储物流数据、物料数据、测量数据、测试数据、人员数据、装配工艺数据、过程数据、监控数据等,工业企业逐步进入了智能化、数据化的发展新阶段,工业企业所拥有的这些数据构成了“航天产品的大数据”。如何充分运用这些海量数据,进行快速高效的计算,挖掘这些数据中潜在的价值,是大数据分析重点解决的问题。在工程应用中,广泛存在着质量问题分类的需求。例如在制造系统中,产品的生产制造过程中或多或少会出现不同的质量问题,这不但影响了产品的质量,同时也影响了生产效率。如果不对产品质量问题进行深入的分析,对质量问题分类,找出不同质量问题的根源所在,产品的质量改善将无从谈起。因此,质量问题分类的研究对改善产品质量、提高企业生产效率、增强企业竞争力有着很强的实际意义。随着工业化与信息化的深度融合,制造企业获得的数据资源也越来越多,应充分利用这些数据资源,提高企业的生产管理水平。产品质量不断改善作为制造系统的一个核心问题,质量问题的分类和分析,能够使企业发现生产过程中的问题所在,帮助企业提高生产效率、增强竞争力。因此,需要对生产制造过程中的各种质量问题和故障,进行深入的分析研究,来改善产品质量,提高企业的生产效率。对于制造企业来讲,导致产品质量问题的因素不仅仅局限于某个环节,而是涉及到机器设备、物料、生产人员、工艺、环境等多个对象,这些环节所涉及的数据,包含物料数据、测量数据、测试数据、人员数据、物料数据、装配工艺数据、过程数据等。因此,质量问题分类需要与大数据分析有机融合,需要通过对企业生产制造过程中各种数据的分析获取导致质量问题的影响因素,进而找出质量问题产生的根源。对于工程应用领域及制造企业中的质量问题分类方法已有了很多研究,但随着企业的智能化、信息化,质量的影响因素更加多样化、复杂化,这就导致要分析的数据呈现多类别、大体量等特点,数据量会达到PB级以上。企业对质量问题进行分析时不但要考虑更多的影响因素,而且对分析结果的实时性提出了更高的要求。所以现代企业要求质量问题分析、分类要能够解决数据量大、计算量大、保证时效性等问题。考虑到现有技术较难处理PB级以上的数据量,而且在处理数据量较大的情况下,分析计算过程耗费时间长,实时性差,精度也难以保证,已经不适用现代企业的要求。所以急需一种大数据分析技术,在保证时效性以及精度的前提下,对PB级以上的数据量进行处理分析。
技术实现思路
本专利技术的目的在于提供一种基于大数据分析的航天产品装配质量问题分类方法,旨在解决质量问题分类,基于大数据分析平台,通过对企业生产制造过程中各种数据的分析,从而预测质量问题发生的类别。本专利技术是这样实现的,一种基于大数据分析的航天产品装配质量问题分类方法,该方法属于质量管理和数据挖掘的交叉领域。所述基于大数据分析的航天产品装配质量问题分类方法基于Hadoop构建大数据分析平台,该平台能可靠地存储和处理PB级别以上的数据;可以通过普通机器组成的服务器群来分发以及处理数据,这些服务器群总计可达数千个节点;通过分发数据,可以在数据所在的节点上并行地处理它们,这使得处理非常的快速;能自动地维护数据的多份复制,并且在任务失败后能自动地重新部署计算任务。总之,大数据平台具有高可靠性、高扩展性、高效性、高容错性等特点。大数据平台通过Sqoop组件技术或Flume组件技术,负责将各类数据从外部数据源抽取到数据存储层;然后采用分布式文件系统(HDFS技术)、行式数据库(采用分布式数据仓库Hive、关系数据库Oracle)、列式数据库(采用Hadoop的HBase组件)实现全类型数据(结构化、半结构化、非结构化)的存储、查询;接着采用MapReduce并行运算模式实现数据计算;最后把分析结论展示出来。基于大数据分析平台,构建支持向量机质量问题分类模型,运用遗传算法对SVM模型的参数进行优化选择,把SVM模型的分类精度作为遗传算法中的个体的适应度值,SVM模型的分类精度满足条件或者遗传代数达到要求,则获得最佳分类精度SVM模型的参数;同时得到最终的GA-SVM模型;不满足停止条件,则继续优化模型,直至满足条件的要求为止。进一步,所述大数据分析平台用于存储历史数据并提供数据的分析挖掘服务;数据包括:仓储物流数据、物料数据、测量数据、测试数据、人员数据、装配工艺数据、过程数据、监控数据等。进一步,所述遗传算法对SVM模型的参数进行优化选择方法包括:第一步:初始化种群,生成一定数量的个体作为初始种群,设置种群数量为20,最大进化代数为100,每个个体的染色体有(C,σ)组成,惩罚因子C的动态变化范围设置为(0,100),高斯核函数参数σ的动态变化范围设置为(0,100);第二步:把支持向量机的分类精度作为每个个体的适应度值,通过事先划分好的训练数据集及对初始种群进行SVM训练,每个个体会得到一个对应的SVM模型;然后用SVM模型对事先划分好的测试数据集进行测试,得到该SVM模型下的测试精度,精度是个体的适应度;第三步:根据特定算法进行选择运算、交叉运算、变异运算得到新一代种群;第四步:如果种群满足终止条件,即由每个个体获得支持向量机的分类精度达到要求或种群迭代次数达到设定值,则输出种群中具有最好分类精度的个体作为最优参数,获得最优分类精度的支持向量机模型进行质量问题分类。如果不满足终止条件,则转入第三步继续执行。进一步,所述选择运算方法包括:保留种群中适应度值排名前10的个体进入下一代,剩余的随机保留,即选取适应度值排名中的中间值。进一步,所述交叉运算方法包括:将交叉概率设置为变量,随着进化代数的增加而减小,种群动态交叉概率的公式为:Pd=Pmax-(Pmax-Pmin)*d/D;其中,Pd为第d代时的交叉概率;Pmax为最大交叉概率;Pmin为最小交叉概率;d为当前的进化代数;D为设置的最大进化代数。进一步,所述变异运算方法包括:种群动态变异概率的公式为:Pk=1–Pkmax;其中,Pk为第k代时的变异率;Pkmax为第k代的父代中最大适应度值。本专利技术提供的基于大数据分析的航天产品装配质量问题分类方法,基于大数据分析技术,运用支持向量机建立分类模型,采用遗传算法对支持向量机的参数进行优化选择;分类模型建立后,对可能产生的质量问题进行预测以及质量趋势进行预测,提前发现问题、解决问题,从而提升企业生产效率。由于支持向量机(SupportVectorMachine)的分类效果受惩罚系数C和核函数参数σ的直接影响,为避免模型参数选择的盲目性和尽可能提高支持向量机的分类性能,利用遗本文档来自技高网
...

【技术保护点】
一种基于大数据分析的航天产品装配质量问题分类方法,其特征在于,所述基于大数据分析的航天产品装配质量问题分类方法基于Hadoop构建大数据分析平台,构建初始SVM(Support Vector Machine)模型,运用遗传算法对SVM模型的参数进行优化选择,把SVM模型的分类精度作为遗传算法中的适应度函数,SVM模型的分类精度满足条件或者进化代数达到要求,则获得最佳分类精度SVM模型的参数;得到最终的GA‑SVM(Genetic Algorithm‑Support VectorMachine)模型;不满足停止条件,则继续优化模型,直至满足条件的要求为止。

【技术特征摘要】
1.一种基于大数据分析的航天产品装配质量问题分类方法,其特征在于,所述基于大数据分析的航天产品装配质量问题分类方法基于Hadoop构建大数据分析平台,构建初始SVM(SupportVectorMachine)模型,运用遗传算法对SVM模型的参数进行优化选择,把SVM模型的分类精度作为遗传算法中的适应度函数,SVM模型的分类精度满足条件或者进化代数达到要求,则获得最佳分类精度SVM模型的参数;得到最终的GA-SVM(GeneticAlgorithm-SupportVectorMachine)模型;不满足停止条件,则继续优化模型,直至满足条件的要求为止。2.如权利要求1所述的基于大数据分析的航天产品装配质量问题分类方法,其特征在于,所述大数据分析平台用于存储历史数据并提供数据的分析挖掘服务,数据包括:仓储物流数据、物料数据、测量数据、测试数据、人员数据、装配工艺数据、过程数据、监控数据等。3.如权利要求1所述的基于大数据分析的航天产品装配质量问题分类方法,其特征在于,所述遗传算法对SVM模型的参数进行优化选择方法包括:第一步:初始化种群,生成一定数量的个体作为初始种群,设置种群数量为20,最大进化代数为100,每个个体的染色体有(C,σ)组成,惩罚因子C的动态变化范围设置为(0,100),高斯核函数参数σ的动态变化范围设置为(0,100);第二步:把支持向量机的分类精度作为每个个体的适应度值,通过事先划分好的训练数据集...

【专利技术属性】
技术研发人员:孔宪光常建涛刘洋洋殷磊马洪波王奇斌
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1