【技术实现步骤摘要】
小批量误差数据的自动校正与分布拟合方法
[0001]本专利技术属于航空生产领域,具体涉及一种基于Anderson
–
Darling检验和循环估计的小批量误差数据的自动校正与分布拟合方法。
技术介绍
[0002]作为工业体系的顶端,航空工业对产品质量的把控十分严格,产品外观测量值与理论值的误差数据的分布特征反应了制造过程的质量信息,是实现统计过程控制、优化和生产管理的基本依据。然而,由于测量方式不当和操作人员更换等因素,误差数据的记录值往往会偏移真实值,这尤其给小批量误差数据的统计分布推断带来了更大的挑战。为此,准确地对小批量误差数据进行自动校正,分析误差数据的统计分布特征具有重要意义。
[0003]目前,大部分文献如:《多变量统计过程控制在反浮选生产过程中的应用》、《融合SCADA数据的风电机组齿轮箱状态评估》、《平整过程在线监测和统计过程控制的研究与实践》和《基于典型数据集的数据预处理方法对比分析》,这些文件公开的内容主要都是在进行统计过程控制之前,会基于4分位法剔除异常数据,即将超出上下4分位数的数据从样本数据中剔除。这种方法适用于大样本的情况,对于小批量过程而言,样本量的进一步减少对分布的拟合不利,一种更合理的方法是通过数据校正的方法找到数据的真实值,从而准确获取数据的统计分布特征。然而,目前数据的预处理方法只局限于数据的正态化、标准化和归一化,其中正态化方法包括Box
‑
Cox转换和Johnson变换等,可以改善数据的正态性和对称性;标准化和归一化方法旨在通过数学运 ...
【技术保护点】
【技术特征摘要】
1.小批量误差数据的自动校正与分布拟合方法,其特征在于:具体包括以下步骤:步骤1:从记录表中读取某小批量生产产品同一特征的年度误差数据;步骤2:对误差数据进行异常数据的清除,得到初始数据集D={x
i
,i=1,
…
,n};步骤3:构建了正态分布、截断正态分布、伽马分布、t分布四个连续分布下的Anderson
–
Darling检验统计量;步骤4:根据Anderson
–
Darling检验量A2的极限分布,构建了正态分布、截断正态分布、伽马分布、t分布四个连续分布下的Anderson
–
Darling检验统计量的p值,通过比较p值大小来确定误差数据的统计分布类型,p值越大表明分布拟合优度越高,即确定的分布类型为j
*
=max
j=1,2,3,4
p
j
;步骤5:基于得到的分布类型j
*
,采用循环估计对每个数据进行自动校正;预先给定一个补偿值δ,并将数据集D随机打乱,划分为历史集D1和观测集D2;规定数据的校正策略,进行不停迭代,得到最终的校正数据;步骤6:设定不同的补偿值δ重复步骤5,以找到最优的补偿值;在该补偿值下,得到最优校正后的数据集D
′
并采用极大似然估计求解分布j
*
的参数。2.根据权利要去1所述的小批量误差数据的自动校正与分布拟合方法,其特征在于:所述步骤3中,为衡量真实数据分布与理论分布的拟合优度,构建了正态分布、截断正态分布、伽马分布、t分布四个连续分布下的Anderson
–
Darling检验统计量如下:式中:代表第j个假设分布的Anderson
–
Darling检验统计量,用于衡量假设分布与数据真实分布的差距,越小表明真实数据越贴近假设的分布,n为样本的个数,F
D
(x)为样本的分布函数;正态分布、截断正态分布、伽马分布、t分布,这四种分布最贴合航空制造领域中误差数据的分布类型,F
j
(x)为第j个假设分布的理论分布函数:分布的理论分布函数:分布的理论分布函数...
【专利技术属性】
技术研发人员:曾静文,李晓蕊,杨扬,邓晓春,郭双明,樊娜娜,陈氖华,
申请(专利权)人:成都飞机工业集团有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。