【技术实现步骤摘要】
一种基于时间序列的空间分析异常检测方法
[0001]本专利技术属于国土规划空间分析异常检测领域,特别是涉及一种基于时间序列的空间分析异常检测方法。
技术介绍
[0002]国土规划空间信息云平台采用分布式系统的管理方式,其规则和复杂性不断增加,使得日志量暴增。目前异常检测在现代大规模分布式系统的管理中起着重要作用,记录系统运行时信息的日志已广泛用于异常检测。在现代分布式系统全天候持续产生大量日志的背景下,基于自动日志分析的异常检测方法成为学术界和工业界具有实际重要性的研究课题。
[0003]如国土规划空间信息云平台这样的现代大规模服务系统,通过数千台机器来扩展构建分布式系统,扩展后分布式系统的高性能计算能够处理用户高并发的访问请求。与此同时,分布式系统下高并发用户访问请求产生的日志给基于日志的异常检测带来挑战。挑战主要集中在两方面:一是从原始日志数据集中识别出同一国土规划空间分析任务,二是基于国土规划空间分析日志的异常检测。
[0004]国土规划空间分析任务虽然可以通过空间分析任务号标识,但是无法区分用户前后多次对同一国土规划空间分析任务进行操作。因此考虑从国土规划空间分析日志数据之间的相关性入手解决上述问题,国土规划日志记录的是空间分析图层的分析返回结果,一次国土规划空间分析任务往往是对一个分析专题进行空间分析,因此同一专题下的不同图层很大概率会被同时分析,所以同一国土规划空间分析任务涉及的图层操作量之间相关性很强,因此可以通过不同图层操作量时间序列来辅助识别同一国土规划空间分析任务操作。
[
【技术保护点】
【技术特征摘要】
1.一种基于时间序列的空间分析异常检测方法,其特征在于,包括如下步骤:步骤1,依据空间分析操作类型、具体的分析图层将图层分析日志原始数据集划分为特定操作类型和图层的子数据集,若子数据集为空,则不进行后续操作;步骤2,统计步骤1划分得到的各个特定操作类型和图层子数据集的操作量时间序列;步骤3,归一化步骤2中统计得到的每个操作量时间序列;步骤4,计算步骤3归一化后的各个操作量时间序列间的DTW距离矩阵W;步骤5,变换步骤4计算得到的操作量时间序列间的DTW距离矩阵为凝聚矩阵W
′
,凝聚矩阵W
′
是距离矩阵W的上三角矩阵的一维表示;步骤6,基于步骤5得到的操作量时间序列间的DTW凝聚矩阵W
′
,用DTW距离替换聚类中各操作量时间序列之间的欧式距离衡量相似度,并基于Single
‑
Link方法自底向上层次聚类操作量时间序列,聚类得到相似的特定操作类型和图层操作量时间序列;步骤7,合并步骤6聚类得到的相似操作量时间序列对应的特定操作类型和图层子数据集;步骤8,基于国土规划空间分析任务号,提取步骤7合并后数据集中同一国土规划空间分析项目的日志记录;步骤9,提取步骤8中同一国土规划空间分析项目“同一次操作”下的日志记录;步骤10,若步骤9中国土规划空间分析项目日志“同一次操作”下的记录耗时超过阈值α,α为经验值,则判定该空间分析项目日志记录为异常操作;步骤11,若步骤9中国土规划空间分析项目日志“同一次操作”下的记录耗时小于等于α,则根据步骤9中同一国土规划空间分析项目“同一次操作”下的日志记录的返回面积、耗时信息判断其是否为异常操作。2.如权利要求1所述的一种基于时间序列的空间分析异常检测方法,其特征在于:所述步骤3中归一化公式如下:其中,X
′
为归一化后操作量时间序列值,X为原始操作量时间序列值,X
min
为最小操作量时间序列值,X
max
为最大操作量时间序列值。3.如权利要求1所述的一种基于时间序列的空间分析异常检测方法,其特征在于:所述步骤4中DTW距离矩阵W的计算方式如下:假定任意两个时间序列L
Ai,Li
(S,t)={S
ii
(t1),S
ii
(t2),
…
,S
ii
(t
i
)}和L
Aj,Lj
(S,t)={S
jj
...
【专利技术属性】
技术研发人员:李锐,吴华意,宋旭颖,董朝阳,赖英杰,洪勇,闫科,
申请(专利权)人:武汉光谷信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。