【技术实现步骤摘要】
针对监测数据的粗差识别及剔除方法、系统、服务器及计算机可读存储介质
[0001]本专利技术涉及安全监测领域,尤其涉及一种针对监测数据的粗差识别及剔除方法、系统、服务器及计算机可读存储介质。
技术介绍
[0002]水工安全领域中,对于监测数据的分析具有重大意义。然而,数据本身的真实性将大大影响分析结果,且实际上,监测数据的序列中难免因某些原因而产生明显与实际情况不符的数据信息,即粗差。粗差的存在会严重影响后续监测数据分析的计算精度。事实上,粗差数据的出现,尤其是较大粗差的出现会导致经典平差结果严重失真或者完全不能使用,为了保证监测数据的处理进度,粗差是在进行安全监测数据分析前必须剔除的数据。
[0003]现有技术中,通过观察监测数据的过程线,凭借工程经验,人为剔除粗差。目前主要的粗差剔除方法有拉依达准则、狄克逊准则、极限误差法等,常规的粗差剔除方法都具有一定的局限性,如某些检验参数的取值都是采用某种数学方法计算出来的估计值,残差的计算也存在近似的过程,因此这些方法有时无法准确的识别粗差数据的存在。
[0004] ...
【技术保护点】
【技术特征摘要】
1.一种针对监测数据的粗差识别及剔除方法,其特征在于,包括以下步骤:S100:获取监测数据,并基于最大熵原理,求解监测数据所在序列的最大熵概率密度函数;S200:根据预设的等级划分标准,对监测数据的数据点的可信度进行划分,形成多个可信度等级,并基于层次分析算法,建立如下一致性判断矩阵:其中,L1、L2分别表示不同的可信度等级的权重对比,取值范围在1~9间;S300:对于L1、L2的每个1~9标度之间的分位点c
i
,随机产生k个判断矩阵,并计算k个判断矩阵的一致性比例,以此作为粒子群算法的适应度函数,求解最优分位点c
best
;S400:根据最优分位点c
best
,在n%范围内划分监测数据的可信度等级的临界概率,并根据临界概率密度函数确定可信度等级的临界值,以实现监测数据的粗差识别与剔除。2.如权利要求1所述的粗差识别及剔除方法,其特征在于,步骤S100包括:S110:获取监测数据;S120:基于最大熵原理构造如下最大熵模型:max H(x)=
‑
∫
R
f(x)ln f(x)dxs.t.∫
R
f(x)dx=1∫
R
x
i
f(x)dx=μ
i
(i=1,2,
…
,n)其中,R为监测数据的序列x所在集合,μ
i
为监测数据的序列x的第i阶原点矩,S130:构造如下拉格朗日函数:其中,λ0、λ
i
为拉格朗日乘子;S140:对上述拉格朗日函数求偏导,令以获得如下最大熵概率密度函数:以获得如下最大熵概率密度函数:3.如权利要求1所述的粗差识别及剔除方法,其特征在于,步骤S140包括:S141:令:
S142:假定λ的初始迭代至λ0,将上述式子在λ0处作一阶泰勒展开:令Δ=λ
‑
λ0,ζ=[μ0‑
G0(λ0),μ1‑
G1(λ1),
…
,μ
n
‑
G
n
(λ
n
)]
T
,则有:S143:将上式简写为:GΔ=ζ,并求解Δ,按λ
i+1
=λ
i
+Δ继续迭代,直至收敛至:Δ≤Δ
min
其中,Δ
min
为预先设定的迭代精度阈值。4.如权利要求1所述的粗差识别及剔除方法,其特征在于,步骤S200包括:S210:根据预设的等级划分标准,对监测数据的数据点的可信度划分为正常点、可疑点和粗差点;S220:以线性方式组成的定性术语构造评语间的一致性判断矩阵,使用取值范围在1~9间的L1、L2分别表示不同的可信度等级的权重对比,将1~9的标度划分为两段;S230:记录c
i
为1~9的标度的分位点,使得定性术语映射为:L1:[1,c),L2[c,9)。5.如权利要求4所述的粗差识别及剔除方法,其特征在于,步骤S220包括:S221:根据定性术语的映射,获得针对监测数据的可信度等级的概率划分的判断矩阵为:S222:计算判断矩阵R所对应的最大特征值和特征向量:R
·
w
*
=λ
max
·
w
*
,其中:λ
max
为判断矩阵的最大特征值,w*为最大特征值对应的特征向量。6.如权利要求1所述的粗差识别及剔除方法,其特征在于,步骤S...
【专利技术属性】
技术研发人员:马靖航,李俊,张群,张鸣伦,咸永财,
申请(专利权)人:国能陕西水电有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。