一种用户侧能源数据的挖掘与分析方法技术

技术编号:16188827 阅读:62 留言:0更新日期:2017-09-12 11:42
本发明专利技术涉及一种用户侧能源数据的挖掘与分析方法,该方法通过数据库中的多能源用能数据信息,选择合适的分析工具、应用统计方法、事例推理、规则推理、模糊集等的数据处理方法,得出有用的分析信息。然后,将数据挖掘所得到分析信息以可视化的方式呈现给客户或供其他应用程序使用。同时,也可以通过上述数据处理分析得出用户用能行为,给客户合理规划资源使用提供科学依据。

User side energy data mining and analysis method

The invention relates to a method of mining and analysis of user side energy data, by means of the method of multi energy database with data information, data processing method, select the appropriate analysis tools, application of statistical method, case-based reasoning, rule-based reasoning, fuzzy set, the analysis of information used. Then, the analyzed information from data mining is presented to the customer in a visual way or used by other applications. At the same time, we can also use the above data to analyze and analyze the user's behavior and provide a scientific basis for the rational planning of the use of resources.

【技术实现步骤摘要】
一种用户侧能源数据的挖掘与分析方法
本专利技术涉及数据挖掘领域,特别涉及一种用户侧能源数据的挖掘与分析方法。
技术介绍
随着国家电网公司用电信息采集系统全面覆盖,以及大数据分析的兴起,数据的价值显得越来越重要。目前根据国家能源局的能源发展规划,在政府的指导下,电力公司、自来水公司、燃气公司纷纷参与了“多表合一”信息采集建设工程,通过电力公司共享的用电信息采集平台,将自来水、燃气、电力数据远程采集到系统主站,解决了自来水、燃气公司人工抄表的问题。实现多表合一采集系统的运营,需对用能侧的水、电、气、热数据进行采集、存储、分析、管理、应用。但对于用户侧采集的海量多能源数据,通过用电信息采集后的数据存储在数据库中,用户侧能源数据有用户信息,每天的用电、用水、用气量,用户缴费情况,用户计量异常情况等数据,没有进行挖掘用能信息,没有通过分析得出用户用能行为,不能给客户合理规划资源使用提供科学依据。
技术实现思路
本专利技术要解决的技术问题是提供一种能为合理规划资源使用提供科学依据的用户侧能源数据的挖掘与分析方法。实现本专利技术目的的技术方案之一是提供一种用户侧能源数据的挖掘与分析方法,包括如下步骤:本文档来自技高网...
一种用户侧能源数据的挖掘与分析方法

【技术保护点】
一种用户侧能源数据的挖掘与分析方法,其特征在于包括如下步骤:①从主站信息采集系统及自来水和燃气公司的业务系统的数据库中获得用户的用户侧能源数据;②按照用户侧能源数据的性质对步骤①得到的数据进行分类,分成三类:第一类为用电、水、气量数据;第二类为用户电、水、气表计异常数据;第三类为用户信誉度数据;第一类数据为用户用电、水、气量数据,反映的是用户的能源消耗使用情况;第二类数据为用户电、水、气表计异常数据,反映的是用户用能习惯是否正常;第三类数据为用户信誉度数据,反映的是用户是否按时缴纳电费、水费、气费,是否为诚信用户,是否存在窃电、水、气等恶意行为,用电、水、气合同履行情况;③对步骤②得到的三类数...

【技术特征摘要】
1.一种用户侧能源数据的挖掘与分析方法,其特征在于包括如下步骤:①从主站信息采集系统及自来水和燃气公司的业务系统的数据库中获得用户的用户侧能源数据;②按照用户侧能源数据的性质对步骤①得到的数据进行分类,分成三类:第一类为用电、水、气量数据;第二类为用户电、水、气表计异常数据;第三类为用户信誉度数据;第一类数据为用户用电、水、气量数据,反映的是用户的能源消耗使用情况;第二类数据为用户电、水、气表计异常数据,反映的是用户用能习惯是否正常;第三类数据为用户信誉度数据,反映的是用户是否按时缴纳电费、水费、气费,是否为诚信用户,是否存在窃电、水、气等恶意行为,用电、水、气合同履行情况;③对步骤②得到的三类数据进行进一步的划分,建立层次结构关系:“用户用电、水、气量数据”一共由6个指标组成,“用户电、水、气表计异常数据”一共由3个指标组成,“用户信誉度数据”由5个指标组成:第一类数据“用户用电、水、气量数据”包括“每月用电量”、“每日用电量”、“每月用水量”、“每日用水量”、“每月用气量”、“每日用气量”6个指标;第二类数据“用户电、水、气表计异常数据”包括“电压监测”、“电流监测”、“表计运行状态监测”、“阀门监测”4个指标;第三类数据“用户信誉度数据”包括“是否恶意拖欠电、水、气费”、“是否有窃电水气恶意行为”、“是否有违约用电水气行为”;④确定各指标的相互关系:根据步骤③得到的各个指标间的关联关系,确定指标间的相互影响,从而求出和实际业务匹配的评价体系;如每月用电量是由当月每日的用电量之和;如下关系表所示,其中*代表具有相关性:⑤确定指标重要程度,根据指标间的相互关系,确定各指标的重要程度:指标的重要程度由步骤④的关系表中与之相关的指标个数决定,0个相关的指标个数代表很不重要,1个相关的指标个数代表不重要,2个相关的指标个数代表一般,3个相关的指标个数代表重要,4个及以上的指标个数代表非常重要;⑥根据步骤⑤得到的指标重要程度确定指标的权重,按照重要程度分为5个等级,其中设定“非常重要”指标权重为5,“重要”指标权重为4,“一般”指标权重为3,“不重要”指标权重为2,“很不重要”指标权重为1;则w=[每月用电量、每日用电量、每月用水量、每日用水量、每月用气量、每日用气量、电压监测、电流监测、表计运行状态监测、阀门监测、是否拖欠电水气费、是否有窃电水气恶意行为、是否有违约用电水气行为]=[4、3、4、3、4、3、5、5、4、2、3、1、3],其中w代表各指标的权重;⑦对w进行归一化处理可得,获取每个指标在指标集中的归一权重值w1,为后续计算做准备:w1=[0.09524,0.07143,0.09524,0.07143,0.09524,0.07143,0.11905,0.11905,0.09524,0.04762,0.07143,0.02381,0.07143];⑧采用直接信号校正系数法修正各指标的权重,具体来讲包括如下步骤:1)为了消除指标间各单位不同和变异数据的影响,由定义指标组成的数据矩阵为自变量X,首先对自变量X进行标准化处理;2)假设各指标之间的权重都为1,由标准化处理后的自变量X乘以权重1,计算出因变量y;3)计算y在X上的线性空间投影:M=X((X′)-1)′y;4)计算X在M上的正交补空间上的投影:Z=X-MM′X;5)对ZZ′进行主成分分析,然后提取前f个需要正交处理的主成分得分矩阵Tf;6)计算权重矩阵Wf=X-1Tf;7)计算新的矩阵Tf,Tf=XWf;8)计算载荷矩阵Pf=X′Tf/(T′fTf);9)对X进行校正,过滤掉X中与y中正交的不相关的信息,得到新的自变量XDOSC,XDOSC=X-TfP′f;10)该新的自变量XDOSC与因变量y之间得到一个新的权重矩阵,即y=C*XDOSC,其中C定义为系数修正权重矩阵;⑨为了得到用户的用能灰色评价矩阵M,将步骤⑦得到的用户用能的指标通过专家基于用户用电情况进行审核评分,再运用灰色白化权函数计算灰色统计数,得到该用户的灰色评价矩阵M;⑩将灰色权重矩阵M与步骤⑧得到的直接信号校正系数法修正后的权重矩阵C相乘,得到新的权重矩阵N;计算评价结果:通过将⑦得到的每个指标在指标集中的归一权重值和⑩计算得到的权重矩阵N相乘,就可以得到每一个用户用能习惯的具体评分结果;按照评价结果对应评价关系表,可得出用户的用能习惯级别,从而相应的给用户不同的管理策略。2.根据权利要求1所述的一种用户侧能源数据的挖掘与分析方法,其特征在于:步骤①中,主站信息采集系统采用多表合一用电信息采集系统。3.根据权利要求1所述的一种用户侧能源数据的挖掘与分析方法,其特征在于:步骤⑨的详细过程如下:灰色白化权函数一共有5种,用f1、f2、f3、f4、f5表示,按照灰色统计数计算的要求,设第一类数据【用户用电、水、气量数据】的六个指标元素为:u1、u2、u3、u4、u5、u6;指标u1由第一个专家审核的得分为b1,指标u1由第二个专家审核的得分为b2,指标u1由第n个专家审核的得分为bn;设定五类灰色白化权函数如下:评价等级1:评价等级2:4评价等级3:评价等级4:评价等级5:则K1=f1(b1:u1)+f1(b2:u1)+…..+f1(bn:u1);k1表示指标u1在灰色函数f1下n个专家的评分总和;K2=f2(b1:u1)+f2(b2:u1)+…..+f2(bn:u1);k2表示指标u1在灰色函数f2下n个专家的评分总和;K3=f3(b1:u1)+f3(b2:u1)+…..+f3(bn:u1);k3表示指标u1在灰色函数f3下n个专家的评分总和;K4=f4(b1:u1)+f4(b2:u1)+…..+f4(bn:u1);k4表示指标u1在灰色函数f4下n个专家的评分总和;K5=f5(b1:u1)+f5(b2:u1)+…..+f5(bn:u1);k5表示指标u1在灰色函数f5下n个专家的评分总和;则u1的灰色统计数S为:S=K1+K2+K3+K4+K5;灰色权重为:S1=K1/S,S2=K2/S,S3=K3/S,S4=K4/S,S5=K5/S;u1的灰色权重行向量[S1,S2,S3,S4,S5];依次运算所有元素u1,…,un的灰色权重行向量,从而获取灰色权重矩阵M。4.根据权利要求1所述的一种用户侧能源数据的挖掘与分析方法,其特征在于:步骤⑨中,通过专家基于用户用电情况对各个指标进行审核评分是基于专家的经验数据判断,部分指标的审核方法参考如下:江苏阶梯电价标准年用电累计未达到2760度电,不执行阶梯电价,年用电量累计超过4800度电量每度加价0.3元,按照江苏阶梯电价标准测算,当平均每日用电量指标低于8度电,执行第一阶梯电价,专家得分设定100分;当平均每日用电量指标高于13度电,执行第三阶梯电价,专家得分设定40分;当平均每日用电量指标在8-13度电时,每高于1度电,指标分加12分,即:每日用电量每月用电量专家得分<=8<2301009230-2648810265-2987611299-3326412331-36652>=13>=40040每月用电量按照江苏阶梯电价标准折算成平均每月用电量的值进行专家得分,当平均每日用电量指标低于230度电,执行第一阶梯电价,专家得分设定100分;当平均每日用电量指标高于400度电,执行第三阶梯电价,专家得分设定40分;当平均每日用电量指标在230-400度电时,每高于34度电,指标分加12分;每日用水量、每月用水量、每日用气量、每月用气量按照规定的用水、用气量阶梯标准计算,参照江苏阶梯电价标准计算方法;用户电、水、气表计异常指标:如果用户表计使用1个月内出现表计损坏,该指标评分为40分,如果用户表计使用2-6个月内出现表计损坏,该指标评分为60分,如果用户表计使用6-12个月内出现表计损坏,该指标评分为80分,如果用户表计使用1-3年内出现表计损坏,该指标评分为90分,如果用户表计使用4-6个月内出现表计损坏,该指标评分为100分;用户信誉度:如果用户在3年内未出现拖欠电水气费行为或窃电、水、气恶意行为,该指标评分为100分,如果用户在3年内出现1次拖欠电水气费行为或窃电、水、气恶意行为,该指标评分为80分,如果用户在3年内出现2次拖欠电水气费行为、窃电、水、气恶意行为窃电、水、气恶意行为,该指标评分为60分,如果用户在3年内出现超过2次拖欠电水气费行为或窃电、水、气恶意行为,该指标评分为40分。5.根据权利要求1所述的一种用户侧能源数据的挖掘与分析方法,其特征在于:步骤中,具体评价结果对应评价关系表如下表所示;将用户用能习惯评价结果根据好与坏分为A、B、C、D、E五类如下:根据用户评价等级的不同开展针对性的管理策略:A类用户,评价状态为优,表示用户用能习惯很好,可以定义为优质用户;对此类用户可以进行可延长其欠费不停电、水、气等服务周期;B类用户,评价状态为良,可适当延长欠费缴费期限;C类用户,评价状态为中,按原计划进行用能习惯建议;D类用户,评价状态为预警,在按原计划进行用能习惯建议的基础上,可免费为其上门提供用能指导;E类用户,评价状态为差,需增加用能建议提醒次数。6.一种用户侧能源数据的挖掘方法,其特征在于包括如下步骤:①从主站信息采集系统及自来水和燃气公司的业务系统的数据库中获得用户的用户侧能源数据;主站信息采集系统采用多表合一的用电信息采集系统;②按照用户侧能源数据的性质对步骤①得到的数据进行分类,分成三类:第一类为用电、水、气量数据;第二类为用户电、水、气表计异常数据;第三类为用户信誉度数据;第一类数据为用户用电、水、气量数据,反映的是用户的能源消耗使用情况;用水、用气数据来源于用电信息采集系统中多表合一信息采集的数据展示日数据和月数据模块;第二类数据为用户电、水、气表计异常数据,反映的是用户用能习惯是否正常;用户电表异常数据主要来源于用电信息采集系统中抄表失败事件模块中的表计故障清单,用户水、气表异常数据主要来源于用电信息采集系统中多表合一信息采集的数据展示模块的未成功获取清单;第三类数据为用户信誉度数据,反映的是用户是否按时缴纳电费、水费、气费,是否为诚信用户,是否存在窃电、水、气等恶意行为,用电、水、气合同履行情况;用户信誉度数据中的用户电费缴费记录情况数据来源于用电信息采集系统的营销业务系统的电量电费模块,用户水、气费缴费记录情况数据来源于自来水和燃气公司的业务系统;③对步骤②得到的三类数据进行进一步的划分,建立层次结构关系:“用户用电、水、气量数据”一共由6个指标组成,“用户电、水、气表计异常数据”一共由3个指标组成,“用户信誉度数据”由5个指标组成:第一类数据“用户用电、水、气量数据”包括“每月用电量”、“每日用电量”、“每月用水量”、“每日用水量”、“每月用气量”、“每日用气量”6个指标;第二类数据“用户电、水、气表计异常数据”包括“电压监测”、“电流监测”、“表计运行状态监测”、“阀门监测”4个指标;第三类数据“用户信誉度数据”包括“是否恶意拖欠电、水、气费”、“是否有窃电水气恶意行为”、“是否有违约用电水气行为”;④确定各指标的相互关系:根据步骤③得到的各个指标间的关联关系,确定指标间的相互影响,从而求出和实际业务匹配的评价体系;如每月用电量是由当月每日的用电量之和;如下关系表所示,其中*代表具有相关性:⑤确定指标重要程度,根据指标间的相互关系,确定各指标的重要程度:指标的重要程度由步骤④的关系表中与之相关的指标个数决定,0个相关的指标个数代表很不重要,1个相关的指标个数代表不重要,2个相关的指标个数代表一般,3个相关的指标个数代表重要,4个及以上的指标个数代表非常重要;⑥根据步骤⑤得到的指标重要程度确定指标的权重,按照重要程度分为5个等级,其中设定“非常重要”指标权重为5,“重要”指标权重为4,“一般”指标权重为3,“不重要”指标权重为2,“很不重要”指标权重为1;则w=[每月用电量、每日用电量、每月用水量、每日用水量、每月用气量、每日用气量、电压监测、电流监测、表计运行状态监测、阀门监测、是否拖欠电水气费、是否有窃电水气恶意行为、是否有违约用电水气行为]=[4、3、4、3、4、3、5、5、4、2、3、1、3],其中w代表各指标的权重;⑦对w进行归一化处理可得,获取每个指标在指标集中的归一权重值w1,为后续计算做准备:w1=[0.09524,0.07143,0.09524,0.07143,0.09524,0.07143,0.11905,0.11905,0.09524,0.04762,0.07143,0.02381,0.07143];⑧采用直接信号校正系数法修正各指标的权重,具体来讲包括如下步骤:1)为了消除指标间各单位不同和变异数据的影响,由定义指标组成的数据矩阵为自变量X,首先对自变量X进行标准化处理;2)假设各指标之间的权重都为1,由标准化处理后的自变量X乘以权重1,计算出因变量y;3)计算y在X上的线性空间投影:M=X((X′)-1)′y;4)计算X在M上的正交补空间上的投影:Z=X-MM′X;5)对ZZ′进行主成分分析,然后提取前f个需要正交处理的主成分得分矩阵Tf;6)计算权重矩阵Wf=X-1Tf;7)计算新的矩阵Tf,Tf=XWf;8)计算载荷矩阵Pf=X′Tf/(T′fTf);9)对X进行校正,过滤掉X中与y中正交的不相关的信息,得到新的自变量XDOSC,XDOSC=X-TfP′f;10)该新的自变量XDOSC与因变量y之间得到一个新的权重矩阵,即y=C*XDOSC,其中C定义为系数修正权重矩阵;⑨为了得到用户的用能灰色评价矩阵M,将步骤⑦得到的用户用能的指标通过专家基于用户用电情况进行审核评分,再运用灰色白化权函数计算灰色统计数,得到该用户的灰色评价矩阵M;⑩将灰色权重矩阵M与步骤⑧得到的直接信号校正系数法修正后的权重矩阵C相乘,得到新的权重矩阵N;计算评价结果:通过将⑦得到的每个指标在指标集中的归一权重值和⑩计算得到的权重矩阵N相乘,就可以得到每一个用户用能习惯的具体评分结果;按照评价结果对应评价关系表,可得出用户的用能习惯级别,从而相应的给用户不同的管理策略;具体评价结果对应评价关系表如下表所示;将用户用能习惯评价结果根据好与坏分为A、B、C、D、E五类如下:评价等级得分范围状态描述A90-100优B80-89良C70-79中D60-69预警E60以下差根据用户评价等级的不同开展针对性的管理策略:A类用户,评价状态为优,表示用户用能习惯很好,可以定义为优质用户;对此类用户可以进行可延长其欠费不停电、水、气等服务周期;B类用户,评价状态为良,可适当延长欠费缴费期限;C类用户,评价状态为中,按原计划进行用能习惯建议;D类用户,评价状态为预警,在按原计划进行用能习惯建议的基础上,可免费为其上门提供用能指导;E类用户,评价状态为差,需增加用能建议提醒次数。7.一种用户侧能源数据的分析方法,其特征在于包括如下步骤:①从主站信息采集系统及自来水和燃气公司的业务系统的数据库中获得用户的用户侧能源数据;主站信息采集系统采用多表合一的用电信息采集系统;②按照用户侧能源数据的性质对步骤①得到的数据进行分类,分成三类:第一类为用电、水、气量数据;第二类为用户电、水、气表计异常数据;第三类为用户信誉度数据;第一类数据为用户用电、水、气量数据,反映的是用户的能源消耗使用情况;用水、用气数据来源于用电信息采集系统中多表合一信息采集的数据展示日数据和月数据模块;第二类数据为用户电、水、气表计异常数据,反映的是用户用能习惯是否正常;用户电表异常数据主要来源于用电信息采集系统中...

【专利技术属性】
技术研发人员:黄申茂霍政界朱元极刘畅陆建波
申请(专利权)人:国网江苏省电力公司常州供电公司国网江苏省电力公司国家电网公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1