一种基于大数据技术的业扩报装档案挖掘分析方法技术

技术编号:32346603 阅读:15 留言:0更新日期:2022-02-20 02:05
本发明专利技术提出的是一种基于大数据技术的业扩报装档案挖掘分析方法。包括业扩报装档案数据仓库的建立和业扩报装档案数据挖掘处理方法;在建立业扩报装档案数据仓库的基础上,利用组合预测模型对业扩报装数据进行处理;在利用遗传算法对k均值聚类进行改进后,进行数据挖掘以获取归档数据之间的关系。所述业扩报装档案数据仓库采用维表法建立,由状态数据层、历史数据层、综合数据层、专用数据层和控制管理组成。所述业扩报装档案数据挖掘处理方法采用组合预测模型对数据进行处理,获取档案数据中的深层次关系。本发明专利技术具有较高的数据处理效率,缩短业扩报装时间,提高企业的经济效益。适宜作为一种基于大数据技术的业扩报装档案挖掘分析方法应用。掘分析方法应用。掘分析方法应用。

【技术实现步骤摘要】
一种基于大数据技术的业扩报装档案挖掘分析方法


[0001]本专利技术涉及电力领域的业扩报装,特别是涉及一种基于大数据技术的业扩报装档案挖掘分析方法。

技术介绍

[0002]业扩报装是受理客户用电申请,依据客户用电的需求并结合供电网络的状况制定安全、经济、合理的供电方案。确定供电工程投资,组织供电工程的设计与实施,组织协调并检查用电客户内部工程的设计与实施,签订供用电合同,装表接电等。是客户申请用电到实际用电全过程中供电部门业务流程的总称。
[0003]目前,业扩报装办理过程中产生了大量的数据信息。业扩报装档案的传统数据分析方法只建立了单一的数据分析模型,没有明确数据之间的深层次关系,导致档案数据的无效利用。

技术实现思路

[0004]为了解决业扩报装档案数据利用的问题,本专利技术提出了一种基于大数据技术的业扩报装档案挖掘分析方法。该通过建立业扩报装档案数据仓库,利用组合预测模型对业扩报装数据进行处理,解决业扩报装档案数据利用的技术问题。
[0005]本专利技术解决技术问题所采用的方案是:一种基于大数据技术的业扩报装档案挖掘分析方法,包括业扩报装档案数据仓库的建立和业扩报装档案数据挖掘处理方法;在建立业扩报装档案数据仓库的基础上,利用组合预测模型对业扩报装数据进行处理;在利用遗传算法对k均值聚类进行改进后,进行数据挖掘以获取归档数据之间的关系。
[0006]所述业扩报装档案数据仓库采用维表法建立,由状态数据层、历史数据层、综合数据层、专用数据层和控制管理组成。
[0007]所述业扩报装档案数据挖掘处理方法采用组合预测模型对数据进行处理,获取档案数据中的深层次关系。
[0008]积极效果,由于本专利技术采用在建立业扩报装档案数据仓库的基础上,利用组合预测模型对业扩报装数据进行处理。在利用遗传算法对k均值聚类进行改进后,进行数据挖掘以获取归档数据之间的关系。分析方法不仅具有较高的数据处理效率,而且将其应用到实际电力运营中,可以有效缩短业扩报装时间,提高企业的经济效益。适宜作为一种基于大数据技术的业扩报装档案挖掘分析方法应用。
附图说明
[0009]图1为业扩报装档案数据仓库组织结构图。
具体实施方式
[0010]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。尽管已经示出和描述了本专利技术的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本专利技术的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由所附权利要求及其等同物限定。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0011]据图所示,一种基于大数据技术的业扩报装档案挖掘分析方法,包括业扩报装档案数据仓库的建立和业扩报装档案数据挖掘处理方法;在建立业扩报装档案数据仓库的基础上,利用组合预测模型对业扩报装数据进行处理;在利用遗传算法对k均值聚类进行改进后,进行数据挖掘以获取归档数据之间的关系。
[0012]所述业扩报装档案数据仓库采用维表法建立,由状态数据层、历史数据层、综合数据层、专用数据层和控制管理组成;所述状态数据层,存储最新的详细数据,当数据从外部进入数据仓库时,首先将其直接放入该层;它可以由通用数据库进行处理,这类数据也称为系统的基础数据。
[0013]所述历史数据层,决策存储在历史数据层和综合数据层所需的信息是基础数据反映的总体趋势或随时间变化的趋势,对基础数据进行分类、分解、汇总和处理,以获取信息;基础数据在时间控制机制下生成历史数据,并将其放入历史数据层,供当前数据层、综合数据层和专题数据层调用。
[0014]所述综合数据层,在综合机制下,对基础数据进行整合提取,生成综合数据,并将其放入综合数据层,包括各种统计数据、指标、评价计算结果、预测分析数据。
[0015]所述专用数据层,存储行业的扩展数据,即通过存储数据分析技术对基础数据进行处理形成的特殊数据。
[0016]所述控制管理,除上述四个数据层外,决策支持还需要使用电力业务部门的外部数据,这些数据共同构成数据仓库的信息源;在控制管理中,通过建立提取器,将来自信息源、影响数据仓库的数据信息转化为数据仓库模式;当信息源中的数据发生变化时,集成器过滤、汇总信息并将其与其他信息合并,以将新信息集成到数据仓库中。
[0017]根据数据仓库模式对电力系统中存储的现有业扩报装档案进行转换,并对业扩报装档案中的数据进行处理。
[0018]业扩报装是以电力系统电网运行为基础,满足用户需求为目标制定的电力服务计划。在电力系统的长期运行过程中,不可避免地会遇到由传感器故障或参数误测引起的数据误差。为了避免对数据挖掘的影响,采用组合预测模型对数据进行处理。组合预测方法是对同一个问题,采用两种以上不同预测方法的预测。它既可是几种定量方法的组合,也可是几种定性的方法的组合,但实践中更多的则是利用定性方法与定量方法的组合。组合的主要目的是综合利用各种方法所提供的信息,尽可能地提高预测精度。
[0019]所述业扩报装档案数据挖掘处理方法采用组合预测模型对数据进行处理,获取档案数据中的深层次关系。
[0020]神经网络组合器选择输入层、隐层和输出层三层BP网络结构,采用Sigmoid函数作为激活函数;采用自适应学习率的改进BP算法,学习率调整公式为:
ꢀꢀꢀꢀꢀ
(1)在公式(1)中,η(k)是步骤的学习速率;e(k)是网络的k阶跃误差。在调整学习速率时,首先检查权重的校正是否能够减小误差函数;如果误差减小,则学习率太小,应适当提高;否则,应降低学习速度,使学习速度随误差而变化,使学习步长增长并趋于稳定,加快神经网络的收敛速度。具体计算步骤如下:(1) 读取神经网络的结构信息和数据信息;(2) 初始化神经网络的隐层权重V
p
、输出层权重W
p
、隐层权重Ψ、输出层阈值φ、分配给的随机值[

1,1]、学习率和动量因子的初始值;(3) 输入样本数据,输入输出数据规范化;(4) 选择一个样本;实际输出y,对网络的输出进行了正向计算,并给出了输出h
p
的计算公式,网络的实际输出是向前计算的,隐藏层和输出层的输出y
i
的计算公式如下:
ꢀꢀꢀ
(2)公式(2)中f(x)为S形函数;m为隐藏层节点数,通过经验公式检验隐藏层数,确定:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)在公式(3)中,p是训练样本数,是输入层的节点数。在隐藏层,采用GARCH模型对业务报表的扩展文件数据进行处理;GARCH(1,1)模型表达式如下:
ꢀꢀꢀꢀꢀꢀꢀ
(4)在公式(4)中,α0、α1和β均为常数。α0›
1,α1≥1,β≥0 ,h
t 是Z
t
的一个条件变量;(5) 计算输出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据技术的业扩报装档案挖掘分析方法,包括业扩报装档案数据仓库的建立和业扩报装档案数据挖掘处理方法;其特征是:在建立业扩报装档案数据仓库的基础上,利用组合预测模型对业扩报装数据进行处理;在利用遗传算法对k均值聚类进行改进后,进行数据挖掘以获取归档数据之间的关系。2.根据权利要求1所述的一种基于大数据技术的业扩报装档案挖掘分析方法,其特征是:所述业扩报装档案数据仓库采用维表法建立,由状态数据层、历史数据层、综合数据层、专用数据层和控制管理组成;所述状态数据层,存储最新的详细数据,当数据从外部进入数据仓库时,首先将其直接放入该层;它可以由通用数据库进行处理,这类数据也称为系统的基础数据;所述历史数据层,决策存储在历史数据层和综合数据层所需的信息是基础数据反映的总体趋势或随时间变化的趋势,对基础数据进行分类、分解、汇总和处理,以获取信息;基础数据在时间控制机制下生成历史数据,并将其放入历史数据层,供当前数据层、综合数据层和专题数据层调用;所述综合数据层,在综合机制下,对基础数据进行整合提取,生成综合数据,并将其放入综合数据层,包括各种统计数据、指标、评价计算结果、预测分析数据;所述专用数据层,存储行业的扩展数据,即通过存储数据分析技术对基础数据进行处理形成的特殊数据;所述控制管理,除上述四个数据层外,决策支持还需要使用电力业务部门的外部数据,这些数据共同构成数据仓库的信息源;在控制管理中,通过建立提取器,将来自信息源、影响数据仓库的数据信息转化为数据仓库模式;当信息源中的数据发生变化时,集成器过滤、汇总信息并将其与其他信息合并,以将新信息集成到数据仓库中。3.根据权利要求1所述的一种基于大数据技术的业扩报装档案挖掘分析方法,其特征是:所述业扩报装档案数据挖掘处理方法采用组合预测模型对数据进行处理,获取档案数据中的深层次关系;神经网络组合器选择输入层、隐层和输出层三层BP网络结构,采用Sigmoid函数作为激活函数;采用自适应学习率的改进BP算法,学习率调整公式为:
ꢀꢀꢀꢀꢀ
(1)在公式(1)中,η(k)是步骤的学习速率;e(k)是网络的k阶跃误差,在调整学习速率时,首先检查权重的校正是否能够减小误差函数;如果误差减小,则学习率太小,应适当提高;否则,应降低学习速度,使学习速度随误差而变化,使学习步长增长并趋于稳定,加快神经网络的收敛速度;具体计算步骤如下:(1) 读取神经网络的结构信息和数据信息;
(2) 初始化神经网络的隐层权重V
p
、输出层权重W
p
、隐层权重Ψ、输出层阈值φ、分配给的随机值[

1,1]、学习率和动量因子的初始值;(3) 输入样本数据,输入输出数据规范化;(4) 选择一个样本;实际输出y,对网络的输出进行了正向计算,并给出了输出h
p
的计算公式,网络的实际输出是向前计算的,隐藏层和输出层的输出y
i
的计算公式如下:
ꢀꢀꢀ
(2)公式(2)中f(x)为S形函数;m为隐藏层节点数,通过经验公式检验隐藏层数,确定:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)在公式(3)中,p是训练样本数,是输入层的节点数,在隐藏层,采用GA...

【专利技术属性】
技术研发人员:高宁曾玲梁海洪沈晓舟张博左越张蓓董阳付临周鑫刘蕤付海东
申请(专利权)人:国网辽宁省电力有限公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1