【技术实现步骤摘要】
大动态范围大离散单区域多点精准确定异常值的方法
本专利技术属于计算机数据处理
,特别涉及了一种大动态范围大离散数据的异常值确定方法。
技术介绍
在计算机建模时,清理数据样本非常重要,可以确保观察结果充分代表问题。有时,数据集可能包含超出预期范围之外的极端值,这些值通常被称为异常值。通过理解甚至去除这些异常值,能够改进建模和模型技能。目前提出的确定数据异常值的方法包括基于距离的方法、基于偏差的方法和基于密度的方法等。这些方法虽然可以找出异常值,但是方法较为繁琐,需要大量的机器学习,尤其是当动态范围较大,异常数据不明显时,通过现有的方法很难查找出来。例如,在分布式光纤振动传感定位技术中,误报率是突出的问题,当系统发生误报时,系统测出的振动点与实际振动点相差几百米。尤其是当传输距离较远时,因为背向散射信号较弱,信号和背景噪声无法区分开来,造成振动定位的误报,因此亟需一种精准定位振动点的方法。
技术实现思路
为了解决上述
技术介绍
提出的技术问题,本专利技术提出了大动态范围大离散单区域多点精准确 ...
【技术保护点】
1.大动态范围大离散单区域多点精准确定异常值的方法,其特征在于,包括以下步骤:/n(1)采集大动态范围大离散单区域样本,提取单区域样本中各点的标准差和离散差,并对标准差和离散差进行阈值处理;/n(2)通过标准差均值前向平移操作处理单区域样本中各点的标准差;/n(3)计算单区域样本内所有点的置信率;/n(4)将所有点置信率分别与置信率阈值比较,判断出样本中的异常点,实现大动态范围大离散单区域多点精准确定异常数值。/n
【技术特征摘要】 【专利技术属性】
1.大动态范围大离散单区域多点精准确定异常值的方法,其特征在于,包括以下步骤:
(1)采集大动态范围大离散单区域样本,提取单区域样本中各点的标准差和离散差,并对标准差和离散差进行阈值处理;
(2)通过标准差均值前向平移操作处理单区域样本中各点的标准差;
(3)计算单区域样本内所有点的置信率;
(4)将所有点置信率分别与置信率阈值比较,判断出样本中的异常点,实现大动态范围大离散单区域多点精准确定异常数值。
2.根据权利要求1所述大动态范围大离散单区域多点精准确定异常值的方法,其特征在于,在步骤(1)中,一次采集N个单区域样本,计算各点的平均值标准差σi和离散差dij:
其中,xij表示第j个样本中第i个点值,i=1,2,…,M,M为采样点数目,j=1,2,…,N。
3.根据权利要求2所述大动态范围大离散单区域多点精准确定异常值的方法,其特征在于,在步骤(1)中,对标准差和离散差进行阈值处理的方法如下:
技术研发人员:孙小菡,徐宛丽,吴宝锋,刘华伟,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。