【技术实现步骤摘要】
一种基于数据驱动的锅炉用气用户偷盗气检测方法及装置
本专利技术涉及计算机
,尤其涉及一种基于数据驱动的锅炉用气用户偷盗气检测方法及装置。
技术介绍
燃气用户的偷盗气现象十分普遍,且冬季采暖用户(锅炉房)的偷盗气行为尤其严重。在燃气使用过程中,锅炉房客户以减少计量气量和降低缴纳气费为目的,采用破坏计量设备,连接旁通等手段进行燃气盗窃。该行为不仅给供气公司造成巨大的经济损失,而且还带来一系列的用气安全隐患和社会问题。及时有效地打击偷盗气,不仅可以降低燃气企业的经济损失,从而切实保障国有资产的安全,还可以减少不规范用气造成的安全问题。现有的锅炉房用户用气异常检测方法存在如下问题:1)用户异常行为的辨别主要依赖业务人员的经验:人工实地巡查,需要查表员核查仪表仪器的外观、铅封和表底数等,依据经验进行分析判断;测算台账供销差后,需要查表员对差额较大的用户通过设备检测和线路普查进行判断;2)用户用气量指标无法及时、全面地反映用户用气真实情况:提取指标所用的系统和手工台账数据时间粒度较粗(年度或月度),且数据更 ...
【技术保护点】
1.一种基于数据驱动的锅炉用气用户偷盗气检测方法,其特征在于,包括:/n获取原始用气数据,对所述原始用气数据进行预处理,得到待检测数据;/n利用基于温度形变分析的正常用气检测算法,对所述待检测数据进行检测,得到无异常用气行为的正常锅炉房;/n获取多源数据的不同类型特征,将所述无异常用气行为的正常用气锅炉房的特征输入OC-SVM模型,得到预测结果,其中,所述不同类型特征包括:锅炉房属性特征、用气统计特征和温度与用气特征,所述预测结果包括:正常锅炉房和偷盗气锅炉房。/n
【技术特征摘要】
1.一种基于数据驱动的锅炉用气用户偷盗气检测方法,其特征在于,包括:
获取原始用气数据,对所述原始用气数据进行预处理,得到待检测数据;
利用基于温度形变分析的正常用气检测算法,对所述待检测数据进行检测,得到无异常用气行为的正常锅炉房;
获取多源数据的不同类型特征,将所述无异常用气行为的正常用气锅炉房的特征输入OC-SVM模型,得到预测结果,其中,所述不同类型特征包括:锅炉房属性特征、用气统计特征和温度与用气特征,所述预测结果包括:正常锅炉房和偷盗气锅炉房。
2.根据权利要求1所述的方法,其特征在于,所述对所述原始用气数据进行预处理包括:
对所述原始用气数据进行数据滤噪,清除错误数据,其中,所述错误数据包括:负值、超出正常读表范围之外的极大正值和同义锅炉房在同一时刻的多个读数;
剔除数据缺失严重的锅炉房,给出数据缺失告警;以及
剔除零值严重的锅炉房,给出大量零值告警。
3.根据权利要求1所述的方法,其特征在于,所述利用基于温度形变分析的正常用气检测算法,对所述待检测数据进行检测,得到无异常用气行为的正常锅炉房包括:
确定用气模式,其中,所述用气模式包括:将合理的用气低谷数据置空,使锅炉房用户在用气低谷期间减少用气的波动行为不被误判为异常;
利用软阈值小波滤噪对所述待检测数据进行小波变换分解,将小于小波阈值的小波系数置零,将大于小波阈值的小波系数减去阈值以向零收缩,非线性地剔除所述待检测数据中小范围的波动与噪声;以及
计算日均气温数据和锅炉房日用气量数据的形变量,依据偷盗气事件对应锅炉房的形变量设定形变阀值,筛选出形变量小于所述形变阀值的正常用气锅炉房用户,形变量大于等于所述形变阀值的用气异常的用户。
4.根据权利要求1所述的方法,其特征在于,所述获取多源数据的不同类型特征包括:
根据锅炉房用户属性数据,提取描述特征,将所述描述特征进行One-Hot编码,其中,所述描述特征至少包括:经营模式、建筑类型和行业类型,每个所述描述特征的维数等于它的可能取值个数;
计算如下统计型特征:日用气量置信区间的分布,关停天数比值分布,关停小时数比值分布,用气持续性,日用气量均值,单位面积日用气量均值,归一化日用气量均值和归一化日用气量标准差;以及
结合用气数据与气温数据,计算如下温度与用气特征:日用气量曲线偏离参照线的幅度和频率,日用气量与日均气温一阶差分比值的均值和方差,日用气量曲线与参照线的相似度,和形变量标准差。
5.根据权利要求1或4所述的方法,其特征在于,所述将所述无异常用气行为的正常用气锅炉房的特征输入OC-SVM模型,得到预测结果包括:
所述OC-SVM求解出包含所述无异常用气行为的正常用气锅炉房的特征的最紧凑决策边界,确定落在边界内的为所述正常锅炉房,落在边界外的为所述偷盗气锅炉房。
6.一种基于数据驱动的锅炉用气用户偷盗气检测方法,其特征在于,包...
【专利技术属性】
技术研发人员:王广清,张耀辉,张大兵,赵新磊,金洁羽,
申请(专利权)人:北京市燃气集团有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。