一种基于灰色理论的乏信息测量数据粗大误差判别方法技术

技术编号:8366759 阅读:325 留言:0更新日期:2013-02-28 05:11
本发明专利技术提供一种基于灰色理论的乏信息测量数据粗大误差判别方法,该方法的步骤为:一、将采集到的乏信息测量数据序列进行预处理,按由小到大排序;二、利用灰色累加方法得到乏信息测量数据灰色包罗线;三、采用灰色判别法则判定测量数据是否含粗大误差;四、利用灰色GM(1,1)动态模型获取乏信息测量数据预测值;五、重复步骤二、三、四,直至测量数据中粗大误差全部被判别。本发明专利技术能实现概率分布未知,小样本量等乏信息特征的测量数据粗大误差的有效判别,测量数据中粗大误差的有效剔除,保证了测量结果的准确性。本方法合理简单,计算简便,大大提高了计算速度,在快速,在线测量方面具有很好的推广应用价值。

【技术实现步骤摘要】

本专利技术属于计量测试领域,具体涉及,该方法涉及到数据建模、数据处理、粗大误差剔除等方面,用于测量数据误差处理,适用于数据样本量小,分布不确定的粗大误差判别。
技术介绍
在测量过程中,不可避免的存在误差。粗大误差又称粗差,指在同一测量条件下多次测量同一量值时,其中的最大值或最小值等个别数据明显偏离它所属样本的其他数据,超出在规定条件下预期的误差。含有粗大误差的测量值称为异常值,也称离群值和坏值。粗大误差产生的原因可能是人员操作、读数或记录时的过失,以及数据复制和计算处理是 所出现的过失和错误,也可能是采样环境的变化的部分数据与原先样本的模型不符合造成的。在进行数据处理过程中,如果将正常数据当作异常值予以剔除,会减少有用的信息,会造成测量精度偏高的假象;反之,如果对混有异常值的数据未加剔除,必然造成测量数据结果与实际不符合。因此在测量过程中,一旦发现异常值就应该在记录中予以剔除,对测量数据中异常值的合理判断和处理,是获得正确测量结果的一个重要前提条件。通常,异常值剔除多采用以下两类方法第一类方法是采用统计方法,按一定的准则判别而剔除会歪曲测量结果的异常数据;第二类,则采用可避免或抑制异常值影响的测量结果及其不确定度的稳健估计。基于统计学理论的集中常用粗大误差统计判别准则主要包括奈尔(Nair)准则、格拉布斯(Grubbs)准则、3 σ准则、Dixon准则。在实际的测量过程中,粗大误差的判别是非常重要和复杂的。例如,在一些破坏性实验中,不仅测量数据少,而且其概率分布通常是未知的。在这种情况下,用经典统计学的方法研究问题是相当困难的。针对这种小样本数据提出了新的解决方法,如王中宇等提出利用灰色累加方法确定一个包罗区域,王广林在此基础上改进算法。柯宏发提出了基于GM(1,1)精度检验的粗大误差剔除方法。李登辉研究了基于测量信息论的小样本数据粗大误差剔除方法。吴维勇将小波理论应用到了数据粗大误差处理方面。
技术实现思路
本专利技术的目的在于提供,它针对测量数据样本量较少,数据分布不明确的特点,构建了一种描述少数据的模型,根据相应的判定法则,实现粗大误差的判别。本专利技术采用的技术方案如下,其特征在于该方法包括如下步骤步骤一、将采集到的乏信息测量数据序列进行预处理,按由小到大排序;步骤二、利用灰色累加方法得到乏信息测量数据灰色包罗线;步骤三、采用灰色判别法则判定测量数据是否含粗大误差;步骤四、利用灰色GM(1,I)动态模型获取乏信息测量数据预测值;步骤五、重复步骤二、三、四,直至测量数据中粗大误差全部被判别。其中,步骤二所述的灰色包罗线的获取,具体实现过程如下首先将η个测量数据从小到大排序,其序列为χ(0)= {χ(0) (1),χ(0) (2),…,χ(0) (η),...} (I)对Χ(°)作累加生成,得到测得值累加数列χ(1)x(l)(k) = f^xm(i) (k = l,2,-,n)(2)=1测得值累加曲线以两条曲线来包罗,由于测量数据的中值最有可能是最大距离值Amax,取测量次数的中值P作为下包络曲线的转折点;另外考虑测量数据有一定程度的变··化,将最大距离值Λ max增加h倍,取常数h为3. 75,其中_ | /2当η是偶数时P {( + I)/2 当η是奇数时(3)下包络曲线方程为 - Δxk - h ~—■ k \< k < ηXiIik) = < _(4) xk - h 丨!mx {n-l ) ρ < /c < "η-ρ取通过坐标原点(0,0)和测量列累加终点(η,χω (η))的直线为上包络曲线,该参考直线方程为λ二⑷=丄x(1)(n)k =k = xk (k = I, 2,...,η) (5)ηη Ι=1式中]f为测量数据的均值。其中,步骤三所述的灰色包罗粗大误差判别准则,具体实现过程如下该测量数列如果都满足条件xZ(k) < xn)(k) < xZ(k),I 彡 k 彡 η (6)则认定测量数据中不含有粗大误差,反之则含有。其中,步骤四所述的灰色GM(1,I)动态模型的建立,具体实现过程如下设升序排列后的数据序列为x(°) = {x(°) (1),x(°) (2),…,χ(0) (η),···},以序列的前η项作为系统的零时刻序列,η为时刻序列长度,构建系统零时刻的灰色模型;零时刻数据序列为X(l(°) = {x0(0)⑴,Χ(ι(°)⑵,…,Χ(ι(°) (η) I,则其对应的一次累加生成序列为x0(1) = {χ0⑴⑴,X0⑴(2),…,x0(1) (n)} (7)式中,== 1,2,-",n,其紧邻均值生成序列为 i=lz0(1) = {z0(1) (2),z0(1) (3),... ζ0(1) (η)} (8)式中,C)=金(I·/)(幻+ χβ(1吩-l)),k = 2,3,…,n,零时刻灰色微分方程为x0(0) (k)+a0z0⑴(k) = b0(9)由式(9)可得,零时刻灰色微分方程的时间响应序列为权利要求1.,其特征在于该方法包括如下步骤 步骤一、将采集到的乏信息测量数据序列进行预处理,按由小到大排序; 步骤二、利用灰色累加方法得到乏信息测量数据灰色包罗线; 步骤三、采用灰色判别法则判定测量数据是否含粗大误差; 步骤四、利用灰色GM(1,1)动态模型获取乏信息测量数据预测值; 步骤五、重复步骤二、三、四,直至测量数据中粗大误差全部被判别。2.根据权利要求I所述的,其特征在于步骤二所述的灰色包罗线的获取,具体实现过程如下 首先将η个测量数据从小到大排序,其序列为3.根据权利要求I所述的,其特征在于步骤三所述的灰色包罗粗大误差判别准则,具体实现过程如下 该测量数列如果都满足条件XiIL ⑷ < -V1)⑷ < X1IL (分),I ≤ k≤ η (6) 则认定测量数据中不含有粗大误差,反之则含有。4.根据权利要求I所述的,其特征在于步骤四所述的灰色GM(1,I)动态模型的建立,具体实现过程如下 设升序排列后的数据序列为x(°) = {x(0) (1),x(°) (2),…,x(°) (n),…},以序列的前η项作为系统的零时刻序列,η为时刻序列长度,构建系统零时刻的灰色模型;零时刻数据序列为xQ(°) = Ixtl(°)⑴,xQ(°)⑵,…,xQ(°) (η)},则其对应的一次累加生成序列为 χ0ω = {x0(1) (I),χ0(1) (2),…,χ0ω (η)} (7) 式中,全文摘要本专利技术提供,该方法的步骤为一、将采集到的乏信息测量数据序列进行预处理,按由小到大排序;二、利用灰色累加方法得到乏信息测量数据灰色包罗线;三、采用灰色判别法则判定测量数据是否含粗大误差;四、利用灰色GM(1,1)动态模型获取乏信息测量数据预测值;五、重复步骤二、三、四,直至测量数据中粗大误差全部被判别。本专利技术能实现概率分布未知,小样本量等乏信息特征的测量数据粗大误差的有效判别,测量数据中粗大误差的有效剔除,保证了测量结果的准确性。本方法合理简单,计算简便,大大提高了计算速度,在快速,在线测量方面具有很好的推广应用价值。文档编号G06F17/10GK102945222SQ201210439870公开日201本文档来自技高网
...

【技术保护点】
一种基于灰色理论的乏信息测量数据粗大误差判别方法,其特征在于:该方法包括如下步骤:步骤一、将采集到的乏信息测量数据序列进行预处理,按由小到大排序;步骤二、利用灰色累加方法得到乏信息测量数据灰色包罗线;步骤三、采用灰色判别法则判定测量数据是否含粗大误差;步骤四、利用灰色GM(1,1)动态模型获取乏信息测量数据预测值;步骤五、重复步骤二、三、四,直至测量数据中粗大误差全部被判别。

【技术特征摘要】

【专利技术属性】
技术研发人员:王中宇王倩王岩庆李强
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1