基于用电时序数据的异常检测方法、系统、设备及介质技术方案

技术编号:39419711 阅读:8 留言:0更新日期:2023-11-19 16:08
本发明专利技术公开了基于用电时序数据的异常检测方法、系统、设备及介质,该方法通过生成第一序列矩阵,计算第一序列矩阵中每列与其余列之间的第一数值相似度和第一变化幅度相似度,根据第一数值相似度和第一变化幅度相似度判断第一序列矩阵中每列的用电时序数据是否正常;生成第二序列矩阵,计算第二序列矩阵中每列与其余列之间的第二数值相似度和第二变化幅度相似度,根据第二数值相似度和第二变化幅度相似度判断第二序列矩阵中每列的用电时序数据是否正常;若第一序列矩阵中每列或第二序列矩阵中每列的用电时序数据异常,计算异常度并将异常度与预设值比较,获得每个用电时序数据的异常检测结果。本发明专利技术能够提高用电时序数据的异常检测效率和准确度。异常检测效率和准确度。异常检测效率和准确度。

【技术实现步骤摘要】
基于用电时序数据的异常检测方法、系统、设备及介质


[0001]本专利技术涉及数据检测
,尤其是涉及一种基于用电时序数据的异常检测方法、系统、设备及介质。

技术介绍

[0002]企业是经济社会发展的基本单元,也是能源消耗的主体。国家要求重点用能单位接入能耗在线监测系统,广泛推动的能源信息统计和动态监测,大力发展系统节能、精细节能、数字节能,构建级的能源管控中心和推动全员参与节能减排。如何从海量的能耗数据中快速、高效的获取有用信息,及时发现设备能源使用过程中的异常,使设备能耗更加合理高效,成为目前高耗能设备节能工作中亟待解决的关键问题。
[0003]当前能耗数据分析方法有经典统计方法、机器学习方法和深度学习方法等。经典异常检测方法会造成较多的异常点和误判的情况;此外,进行统计方法是利用数据的分布来观察异常值,一些方法甚至需要一些分布条件,而在实际中数据的分布很难达到一些假设条件,在使用上有一定的局限性。机器学习中的方法K

means聚类方法对噪声和孤立点数据敏感,而且需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,一旦初始聚类中心选择的不好,可能无法得到有效的聚类结果,得不到全局最优;当数据量非常大时,算法的时间开销非常大。深度学习技术也被用于能耗数据的异常检测,但大规模、非线性参数学习能力更强的深度学习进行异常检测的需要大量的正确数据,利用大量的正确数据训练深度学习模型,而训练后深度学习模型的精度无法修正,且当前对深度学习效果无法进行解释,电力数据异常检测效果不好。
>
技术实现思路

[0004]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种基于用电时序数据的异常检测方法、系统、设备及介质,能够提高用电时序数据的异常检测效率和准确度。
[0005]第一方面,本专利技术实施例提供了一种基于用电时序数据的异常检测方法,所述基于用电时序数据的异常检测方法包括:
[0006]生成周期性的用电时序数据序列;其中,所述用电时序数据序列包括工作时的第一用电时序数据子序列和休息时的第二用电时序数据子序列;
[0007]基于所述第一用电时序数据子序列,生成第一序列矩阵,并计算所述第一序列矩阵中每列的多个第一特征值和第一特征向量;所述多个第一特征值包括第一均值、第一方差、第一斜率;
[0008]根据所述多个第一特征值计算所述第一序列矩阵中每列与其余列之间的第一数值相似度和根据所述第一特征向量计算所述第一序列矩阵中每列与其余列之间的第一变化幅度相似度;并根据所述第一数值相似度和所述第一变化幅度相似度判断所述第一序列矩阵中每列的用电时序数据是否正常;
[0009]基于所述第二用电时序数据子序列,生成第二序列矩阵,并计算所述第二序列矩阵中每列的多个第二特征值和第二特征向量;所述多个第二特征值包括第二均值、第二方差、第二斜率;
[0010]根据所述多个第二特征值计算所述第二序列矩阵中每列与其余列之间的第二数值相似度和根据所述第二特征向量计算所述第二序列矩阵中每列与其余列之间的第二变化幅度相似度;并根据所述第二数值相似度和所述第二变化幅度相似度判断所述第二序列矩阵中每列的用电时序数据是否正常;
[0011]若所述第一序列矩阵中每列或所述第二序列矩阵中每列的用电时序数据异常,则采用局部异常因子算法计算所述第一序列矩阵中每列或所述第二序列矩阵中每列的每个用电时序数据与其对应行的其他用电时序数据之间的异常度,并将所述异常度与预设值比较,获得所述每个用电时序数据的异常检测结果。
[0012]与现有技术相比,本专利技术第一方面具有以下有益效果:
[0013]本方法基于第一用电时序数据子序列,生成第一序列矩阵,并计算第一序列矩阵中每列的多个第一特征值和第一特征向量,根据多个第一特征值计算第一序列矩阵中每列与其余列之间的第一数值相似度和根据第一特征向量计算第一序列矩阵中每列与其余列之间的第一变化幅度相似度,并根据第一数值相似度和第一变化幅度相似度判断第一序列矩阵中每列的用电时序数据是否正常,通过第一数值相似度和第一变化幅度相似度计算,能够剪枝部分正常点选出部分可疑数据,能够为后期的异常检测减少计算量,大大提高计算的效率;基于第二用电时序数据子序列,生成第二序列矩阵,并计算第二序列矩阵中每列的多个第二特征值和第二特征向量,根据多个第二特征值计算第二序列矩阵中每列与其余列之间的第二数值相似度和根据第二特征向量计算第二序列矩阵中每列与其余列之间的第二变化幅度相似度,并根据第二数值相似度和第二变化幅度相似度判断第二序列矩阵中每列的用电时序数据是否正常,通过第二数值相似度和第二变化幅度相似度计算,能够剪枝部分正常点选出部分可疑数据,能够为后期的异常检测减少计算量,大大提高计算的效率;若第一序列矩阵中每列或第二序列矩阵中每列的用电时序数据异常,则采用局部异常因子算法计算第一序列矩阵中每列或第二序列矩阵中每列的每个用电时序数据与其对应行的其他用电时序数据之间的异常度,并将异常度与预设值比较,获得每个用电时序数据的异常检测结果,只进行异常序列的数据点异常检测,能够提高数据异常检测的效率和准确度。
[0014]根据本专利技术的一些实施例,通过如下方式计算所述第一均值:
[0015]对所述第一序列矩阵中每列的所有用电时序数据进行求和,获得第一总数值;
[0016]对所述第一总数值与所述第一序列矩阵中每列的时间窗口长度进行比值,获得第一均值。
[0017]根据本专利技术的一些实施例,通过如下方式计算所述第一方差:
[0018]将所述第一序列矩阵中每列的每个用电时序数据与所述均值相减,获得差值;
[0019]对所述第一序列矩阵中每列的每个差值进行求和,获得第二总数值;
[0020]对所述第二总数值与所述第一序列矩阵中每列的时间窗口长度进行比值,获得第一方差。
[0021]根据本专利技术的一些实施例,通过如下方式计算所述第一斜率:
[0022]计算所述第一序列矩阵中每列中相邻两个用电时序数据之间的差值,并对所有差值进行求和,获得第三总数值;
[0023]对所述第三总数值与所述第一序列矩阵中每列的时间窗口长度减一的差值进行比值,获得第一斜率。
[0024]根据本专利技术的一些实施例,通过如下方式计算所述第一数值相似度:
[0025][0026]其中,ρ表示所述第一数值相似度,表示第r列序列的第一均值,表示第r+j列序列的第一均值,表示第r列序列的第一方差,表示第r+j列序列的第一方差,表示第r列序列的第一斜率,表示第r+j列序列的第一斜率。
[0027]根据本专利技术的一些实施例,通过如下方式计算所述第一特征向量:
[0028]计算所述第一序列矩阵中每列的每个用电时序数据与其相邻的后一个用电时序数据之间的差值;
[0029]对每个所述差值与所述用电时序数据进行比值,获得第一特征向量。
[0030]根据本专利技术的一些实施例,采用余弦相似度计算所述第一变化幅度相似度。
[00本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于用电时序数据的异常检测方法,其特征在于,所述基于用电时序数据的异常检测方法包括:生成周期性的用电时序数据序列;其中,所述用电时序数据序列包括工作时的第一用电时序数据子序列和休息时的第二用电时序数据子序列;基于所述第一用电时序数据子序列,生成第一序列矩阵,并计算所述第一序列矩阵中每列的多个第一特征值和第一特征向量;所述多个第一特征值包括第一均值、第一方差、第一斜率;根据所述多个第一特征值计算所述第一序列矩阵中每列与其余列之间的第一数值相似度和根据所述第一特征向量计算所述第一序列矩阵中每列与其余列之间的第一变化幅度相似度;并根据所述第一数值相似度和所述第一变化幅度相似度判断所述第一序列矩阵中每列的用电时序数据是否正常;基于所述第二用电时序数据子序列,生成第二序列矩阵,并计算所述第二序列矩阵中每列的多个第二特征值和第二特征向量;所述多个第二特征值包括第二均值、第二方差、第二斜率;根据所述多个第二特征值计算所述第二序列矩阵中每列与其余列之间的第二数值相似度和根据所述第二特征向量计算所述第二序列矩阵中每列与其余列之间的第二变化幅度相似度;并根据所述第二数值相似度和所述第二变化幅度相似度判断所述第二序列矩阵中每列的用电时序数据是否正常;若所述第一序列矩阵中每列或所述第二序列矩阵中每列的用电时序数据异常,则采用局部异常因子算法计算所述第一序列矩阵中每列或所述第二序列矩阵中每列的每个用电时序数据与其对应行的其他用电时序数据之间的异常度,并将所述异常度与预设值比较,获得所述每个用电时序数据的异常检测结果。2.根据权利要求1所述的基于用电时序数据的异常检测方法,其特征在于,通过如下方式计算所述第一均值:对所述第一序列矩阵中每列的所有用电时序数据进行求和,获得第一总数值;对所述第一总数值与所述第一序列矩阵中每列的时间窗口长度进行比值,获得第一均值。3.根据权利要求2所述的基于用电时序数据的异常检测方法,其特征在于,通过如下方式计算所述第一方差:将所述第一序列矩阵中每列的每个用电时序数据与所述均值相减,获得差值;对所述第一序列矩阵中每列的每个差值进行求和,获得第二总数值;对所述第二总数值与所述第一序列矩阵中每列的时间窗口长度进行比值,获得第一方差。4.根据权利要求3所述的基于用电时序数据的异常检测方法,其特征在于,通过如下方式计算所述第一斜率:计算所述第一序列矩阵中每列中相邻两个用电时序数据之间的差值,并对所有差值进行求和,获得第三总数值;对所述第三总数值与所述第一序列矩阵中每列的时间窗口长度减一的差值进行比值,获得第一斜率。
5.根据权利要求4所述的基于用电时序数据的异常检测方法,其特征在于,通过如下方式计算所述第一数值相似度:其中,ρ表示所述第一数值相似度,表示第r列序列的第一均值,表示第r+j列序列的第一均值,表示第r列序列的第一方差,表示第r+j列...

【专利技术属性】
技术研发人员:王永昌丁嘉星卢凡
申请(专利权)人:树根互联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1