一种基于用户画像的燃气异常检测方法技术

技术编号:30411018 阅读:30 留言:0更新日期:2021-10-20 11:42
本发明专利技术属于燃气安全技术领域,本发明专利技术提供一种基于用户画像的燃气异常检测方法,包括:对燃气用户的用户数据进行预处理,得到时段数据;利用从所述时段数据中提取的特征,构建燃气用户的用户画像;利用所述燃气用户的用户画像和所述时段数据,检测所述燃气用户的异常行为;其中,所述用户数据包括瞬时流量数据和用气量数据。本发明专利技术针对目前燃气用户画像技术相对处于空白领域,燃气领域中的异常检测途径较为单一,提出了一种利用燃气用户画像的异常检测方法,该方法在能够对燃气用户数据进行画像构建,并利用构建的画像进行异常检测,检测出用户数据是否存在异常。用户数据是否存在异常。用户数据是否存在异常。

【技术实现步骤摘要】
一种基于用户画像的燃气异常检测方法


[0001]本专利技术涉及燃气安全
,尤指一种基于用户画像的燃气异常检测方法。

技术介绍

[0002]随着全国燃气行业模式的转变,燃气企业日趋智能化。通过智能诊断技术监测用气情况,并及时预警、提醒成为燃气企业及时止损的重要方法。对燃气用户进行画像可以帮助相关人员准确分析用户的行为特征。但目前燃气用户画像研究仍处于相对空白区域,同时燃气异常检测途径也较为单一。
[0003]现有的异常检测主要集中在调压器、计量表等固件检测方案,用户画像技术则在燃气领域尚未有应用。
[0004]因此如何构建燃气用户画像,以及更多途径检测用户异常用气行为成为一个急需解决的问题。

技术实现思路

[0005]本专利技术提供一种基于用户画像的燃气异常检测方法,解决上述问题。
[0006]本专利技术提供的技术方案如下:
[0007]一种基于用户画像的燃气异常检测方法,包括:
[0008]对燃气用户的用户数据进行预处理,得到时段数据;
[0009]利用从所述时段数据中提取的特征,构建燃气用户的用户画像;
[0010]利用所述燃气用户的用户画像和所述时段数据,检测所述燃气用户的异常行为;
[0011]其中,所述用户数据包括瞬时流量数据和用气量数据。
[0012]进一步优选的,所述对燃气用户的用户数据进行预处理,得到时段数据,包括步骤:
[0013]将所述瞬时量数据和所述用气量数据按照时段划分,对第一时段进行求取均值操作,以及对第二时段进行补零,生成时段数据;
[0014]其中,所述第一时段包括存在所述瞬时量数据和所述用气量数据的时段,所述第二时段为不存在所述瞬时量数据和所述用气量数据的时段;
[0015]对所述时段数据进行二次处理,具体包括:
[0016]将时段数据中首端数据和末端数据赋值到新列表;
[0017]将所述时段数据中不为零的数据赋值到新列表;
[0018]将所述时段数据中为零的数据,使用所述时段数据的左右相邻数据之和的均值赋值到新列表,形成处理后的时段数据,零数据补值公式为:
[0019][0020]式中,n为样本大小,m为时段个数,d
i,j
为填补的数据,d
i,j
‑1为所述时段数据中零值点前一个数据点的值,d
i,j+1
为所述时段数据中零值点后一个数据点的值。
[0021]进一步优选的,在所述利用从所述时段数据中提取的特征,构建燃气用户的用户画像之前,还包括步骤:
[0022]利用处理后的时段数据,使用k

means算法进行聚类分析,以获取确定所述燃气用户的行为数量和行为类型;
[0023]基于所述行为数量和所述行为类型以及所述处理后的时段数据,进行所述行为数量对应的聚类,得到所述燃气用户的用气类的目标日负荷曲线;
[0024]利用所述目标日负荷曲线,获取所述燃气用户的特征。
[0025]进一步优选的,所述利用所述目标日负荷曲线,获取所述燃气用户的特征,包括步骤:
[0026]基于所述目标日负荷曲线,获取所述日最大负荷特征、日均负荷特征、日用气时段系数特征、日用气量特征、用气负荷相似度特征、用气负荷冲击度特征,具体包括:
[0027]所述日最大负荷特征为每天0时至24时之间,所述燃气用户使用燃气的瞬时流量最大值:
[0028]d(i)
max
=Max(d
i,1
,d
i,2
,

d
i,j
,

d
i,m
)i=1,2

,n
[0029]其中,j∈(1,m),d(i)
max
表示第i天的单日最大负荷值,d
i,j
表示第i天中第j个时间点的瞬时流量;
[0030]所述日均负荷特征包括所述燃气用户在每天0时至24时之间,m个统计点的瞬时流量的平均值:
[0031]d(i)
mean
=Mean(d
i,1
,d
i,2
,

d
i,j
,

d
i,m
)i=1,2

,n
[0032]其中,d(i)
mean
表示第i天的日均负荷,d
i,j
表示第i天中第j个时间点的瞬时流量;
[0033]日用气时段系数特征,是指某日0时至24时之间,m个计量点中的非零值占总个数的系数。
[0034][0035]其中,d(i)
work_time
表示第i天存在用气数据时段占总时段的系数,d
i,j
(Zero)为 BOOL类型变量值;
[0036]所述日用气量特征包括所述燃气用户当日的总用气量: d(i)
DayUse
=Max(Use
i,1
,

,Use
i,k
)

Min(Use
i,1
,

,Use
i,k
)i=1,2

,n;
[0037]其中,d(i)
DayUse
为第i天的总用气量,Max(Use
i,1
,

,Use
i,k
)表示第i天的燃气总用量的最大值,Min(Use
i,1
,

,Use
i,k
)为燃气总用量的最小值,k为第i天的计量点个数。
[0038]进一步优选的,所述利用所述目标日负荷曲线,获取所述燃气用户的特征,还包括步骤:
[0039]基于所述目标日负荷曲线,获取用气负荷相似度特征,具体包括:
[0040]利用所述目标日用气负荷曲线,基于Pearson系数法计算每日用气负荷曲线与典型负荷曲线的相似度,得到用气相似度,具体公式如下:
[0041][0042][0043]其中,p(P
i
,P
j
)为P
i
、P
j
的协方差;分别为P
i
、P
j
的标准差; Pearson(P
i
,P)为用气负荷相似度矩阵;P
i
为所述目标日负荷曲线,P为n天数据的每日负荷曲线。
[0044]进一步优选的,所述利用所述目标日负荷曲线,获取所述燃气用户的特征,还包括步骤:
[0045]基于所述目标日负荷曲线,获取用气负荷冲击度特征,具体包括:
[0046]通过移动平均法得到每日的日负荷曲线,并通过计算实际值与平滑预测值的距离以得到所述用气负荷冲击度特征,具体公本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户画像的燃气异常检测方法,其特征在于,包括:对燃气用户的用户数据进行预处理,得到时段数据;利用从所述时段数据中提取的特征,构建燃气用户的用户画像;利用所述燃气用户的用户画像和所述时段数据,检测所述燃气用户的异常行为;其中,所述用户数据包括瞬时流量数据和用气量数据。2.根据权利要求1所述基于用户画像的燃气异常检测方法,其特征在于,所述对燃气用户的用户数据进行预处理,得到时段数据,包括步骤:将所述瞬时量数据和所述用气量数据按照时段划分,对第一时段进行求取均值操作,以及对第二时段进行补零,生成时段数据;其中,所述第一时段包括存在所述瞬时量数据和所述用气量数据的时段,所述第二时段为不存在所述瞬时量数据和所述用气量数据的时段;对所述时段数据进行二次处理,具体包括:将时段数据中首端数据和末端数据赋值到新列表;将所述时段数据中不为零的数据赋值到新列表;将所述时段数据中为零的数据,使用所述时段数据的左右相邻数据之和的均值赋值到新列表,形成处理后的时段数据,零数据补值公式为:其中,n为样本大小,m为时段个数,d
i,j
为填补的数据,d
i,j
‑1为所述时段数据中零值点前一个数据点的值,d
i,j+1
为所述时段数据中零值点后一个数据点的值。3.根据权利要求2所述基于用户画像的燃气异常检测方法,其特征在于,在所述利用从所述时段数据中提取的特征,构建燃气用户的用户画像之前,还包括步骤:利用处理后的时段数据,使用k

means算法进行聚类分析,以获取确定所述燃气用户的行为数量和行为类型;基于所述行为数量和所述行为类型以及所述处理后的时段数据,进行所述行为数量对应的聚类,得到所述燃气用户的用气类的目标日负荷曲线;利用所述目标日负荷曲线,获取所述燃气用户的特征。4.根据权利要求3所述基于用户画像的燃气异常检测方法,其特征在于,所述利用所述目标日负荷曲线,获取所述燃气用户的特征,包括步骤:基于所述目标日负荷曲线,获取所述日最大负荷特征、日均负荷特征、日用气时段系数特征、日用气量特征、用气负荷相似度特征、用气负荷冲击度特征,具体包括:所述日最大负荷特征为每天0时至24时之间,所述燃气用户使用燃气的瞬时流量最大值:d(i)
max
=Max(d
i,1
,d
i,2
,

d
i,j
,

d
i,m
)i=1,2

,n;其中,j∈(1,m),d(i)
max
表示第i天的单日最大负荷值,d
i,j
表示第i天中第j个时间点的瞬时流量;所述日均负荷特征包括所述燃气用户在每天0时至24时之间,m个统计点的瞬时流量的平均值:d(i)
mean
=Mean(d
i,1
,d
i,2
,

d
i,j
,

d
i,m
)i=1,2

,n;
其中,d(i)
mean
表示第i天的日均负荷,d
i,j
表示第i天中第j个时间点的瞬时流量;所述日用气时段系数特征是指某日0时至24时之间,m个计量点中的非零值占总个数的系数:其中,d(i)
work_time
表示第i天存在用气数据时段占总时段的系数,d
i,j
(Zero)为BOOL类型变量值;所述日用气量特征包括所述燃气用户当日的总用气量:d(i)
DayUse
=Max(Use
i,1
,

,Use
i,k
)

Min(Use
i,1
,

,Use
i,k
)i=1,2

,n;其中,d...

【专利技术属性】
技术研发人员:胡殿涛王超群陈小辉
申请(专利权)人:上海航天能源股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1