一种基于多维数据分布密度的水质数据异常预警的方法技术

技术编号:31310400 阅读:85 留言:0更新日期:2021-12-12 21:40
本发明专利技术公开一种基于多维数据分布密度的水质数据异常预警的方法。所述方法包括采集多维水质指标数据点,基于非线性降维算法将多维水质指标数据点映射到二维坐标体系中,得到二维水质数据点;根据二维水质数据点运用局部异常因子算法计算二维空间水质数据分布的局部异常因子;根据局部异常因子确定水质异常点。本发明专利技术克服了单因子预警检出率低且误报率高的问题,实现了高维水质指标数据点可视化,能够直观的了解数据分布的变化异常,并能够准确的计算出高维水质数据异常点,具有更高的异常检出率和较低的误报率。检出率和较低的误报率。检出率和较低的误报率。

【技术实现步骤摘要】
一种基于多维数据分布密度的水质数据异常预警的方法


[0001]本专利技术涉及水质异常预警领域,尤其涉及一种基于多维数据分布密度的水质数据异常预警的方法。

技术介绍

[0002]水质异常检测是水污染预警系统的重要组成部分,能够及时有效的发现污染物泄漏或人为投毒事故,并给出预警信息和辅助处理手段,对保障水体系统安全,提高快速应急能力具有重大意义。
[0003]大多现有水质监测方法是只根据单个水质指标是否超标来判断水质异常,或者是通过监测两个(或两两组合)数据相关性高的水质指标的变化趋势来判断水质是否异常。
[0004]单个水质指标监技术得到的检出率低且误报率高,两个(或两两组合)水质指标监测技术只能监测相关性高的两两指标之间变化趋势的异常,而缺乏一种便于软件实现原始多指标集直观、可视化、可评价的方法。

技术实现思路

[0005]本专利技术提供了一种基于多维数据分布密度的水质数据异常预警的方法,包括:
[0006]采集多维水质指标数据点,基于非线性降维算法将多维水质指标数据点映射到二维坐标体系中,得到二维水质数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多维数据分布密度的水质数据异常预警的方法,其特征在于,包括:采集多维水质指标数据点,基于非线性降维算法将多维水质指标数据点映射到二维坐标体系中,得到二维水质数据点;根据二维水质数据点运用局部异常因子算法计算二维空间水质数据分布的局部异常因子;根据局部异常因子确定水质异常点。2.如权利要求1所述的基于多维数据分布密度的水质数据异常预警的方法,其特征在于,将多维水质指标数据点映射到二维坐标体系中,具体包括如下子步骤:采集某一时刻原始高维水质数据点集合A={A1,A2,

A
n
},设二维映射点集合B={B1,B2,

B
n
};计算原始高维水质数据点A
i
、A
j
之间的相似性P
ji
,并计算水质点A
j
作为水质点A
i
临近点的概率P
j/i
;计算二维映射点B
i
、B
j
之间的相似性q
j/i
;最小化原始高维水质数据点A和二维映射点B两个分布之间的差距C,得到水质多维数据分布密度的二维表示,即二维空间水质数据b。3.如权利要求2所述的基于多维数据分布密度的水质数据异常预警的方法,其特征在于,原始高维水质数据点A
i
、A
j
之间的相似性P
ji
的计算公式为:其中,A
i
∈A、A
j
∈A,||A
i

A
j
||2表示A
i
与A
j
两点之间的距离;||A
k

A
l
||2表示集合A中所有任意两点间距离;σ
i
表示中心在A
i
的高斯分布标准差。4.如权利要求3所述的基于多维数据分布密度的水质数据异常预警的方法,其特征在于,最佳σ的确定是通过预先设置的复杂度因子Perp(P
i
),用二分搜索的方式来寻找:其中,Perp(P
i
)表示A
i
附近的有效近邻点的个数,H(P
i
)=


j
P
ji
log2P
ji
,将该公式代入相似性计算公式中,确定最佳的σ。5.如权利要求3所述的基于多维数据分布密度的水质数据异常预警的方法,其特征在于,水质点A
j
作为水质点A
i
临近点的概率P
j/i
...

【专利技术属性】
技术研发人员:王正安新国董雅欠邹志强
申请(专利权)人:北京金水永利科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1