一种基于大数据技术的业扩报装档案挖掘分析方法技术

技术编号：32346603 阅读：15 留言：0更新日期：2022-02-20 02:05

本发明专利技术提出的是一种基于大数据技术的业扩报装档案挖掘分析方法。包括业扩报装档案数据仓库的建立和业扩报装档案数据挖掘处理方法；在建立业扩报装档案数据仓库的基础上，利用组合预测模型对业扩报装数据进行处理；在利用遗传算法对k均值聚类进行改进后，进行数据挖掘以获取归档数据之间的关系。所述业扩报装档案数据仓库采用维表法建立，由状态数据层、历史数据层、综合数据层、专用数据层和控制管理组成。所述业扩报装档案数据挖掘处理方法采用组合预测模型对数据进行处理，获取档案数据中的深层次关系。本发明专利技术具有较高的数据处理效率，缩短业扩报装时间，提高企业的经济效益。适宜作为一种基于大数据技术的业扩报装档案挖掘分析方法应用。掘分析方法应用。掘分析方法应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大数据技术的业扩报装档案挖掘分析方法

[0001]本专利技术涉及电力领域的业扩报装，特别是涉及一种基于大数据技术的业扩报装档案挖掘分析方法。

技术介绍

[0002]业扩报装是受理客户用电申请，依据客户用电的需求并结合供电网络的状况制定安全、经济、合理的供电方案。确定供电工程投资，组织供电工程的设计与实施，组织协调并检查用电客户内部工程的设计与实施，签订供用电合同，装表接电等。是客户申请用电到实际用电全过程中供电部门业务流程的总称。
[0003]目前，业扩报装办理过程中产生了大量的数据信息。业扩报装档案的传统数据分析方法只建立了单一的数据分析模型，没有明确数据之间的深层次关系，导致档案数据的无效利用。

技术实现思路

[0004]为了解决业扩报装档案数据利用的问题，本专利技术提出了一种基于大数据技术的业扩报装档案挖掘分析方法。该通过建立业扩报装档案数据仓库，利用组合预测模型对业扩报装数据进行处理，解决业扩报装档案数据利用的技术问题。
[0005]本专利技术解决技术问题所采用的方案是：一种基于大数据技术的业扩报装档案挖掘分析方法，包括业扩报装档案数据仓库的建立和业扩报装档案数据挖掘处理方法；在建立业扩报装档案数据仓库的基础上，利用组合预测模型对业扩报装数据进行处理；在利用遗传算法对k均值聚类进行改进后，进行数据挖掘以获取归档数据之间的关系。
[0006]所述业扩报装档案数据仓库采用维表法建立，由状态数据层、历史数据层、综合数据层、专用数据层和控制管理组成。
[0007...

【技术保护点】

【技术特征摘要】
1.一种基于大数据技术的业扩报装档案挖掘分析方法，包括业扩报装档案数据仓库的建立和业扩报装档案数据挖掘处理方法；其特征是：在建立业扩报装档案数据仓库的基础上，利用组合预测模型对业扩报装数据进行处理；在利用遗传算法对k均值聚类进行改进后，进行数据挖掘以获取归档数据之间的关系。2.根据权利要求1所述的一种基于大数据技术的业扩报装档案挖掘分析方法，其特征是：所述业扩报装档案数据仓库采用维表法建立，由状态数据层、历史数据层、综合数据层、专用数据层和控制管理组成；所述状态数据层，存储最新的详细数据，当数据从外部进入数据仓库时，首先将其直接放入该层；它可以由通用数据库进行处理，这类数据也称为系统的基础数据；所述历史数据层，决策存储在历史数据层和综合数据层所需的信息是基础数据反映的总体趋势或随时间变化的趋势，对基础数据进行分类、分解、汇总和处理，以获取信息；基础数据在时间控制机制下生成历史数据，并将其放入历史数据层，供当前数据层、综合数据层和专题数据层调用；所述综合数据层，在综合机制下，对基础数据进行整合提取，生成综合数据，并将其放入综合数据层，包括各种统计数据、指标、评价计算结果、预测分析数据；所述专用数据层，存储行业的扩展数据，即通过存储数据分析技术对基础数据进行处理形成的特殊数据；所述控制管理，除上述四个数据层外，决策支持还需要使用电力业务部门的外部数据，这些数据共同构成数据仓库的信息源；在控制管理中，通过建立提取器，将来自信息源、影响数据仓库的数据信息转化为数据仓库模式；当信息源中的数据发生变化时，集成器过滤、汇总信息并将其与其他信息合并，以将新信息集成到数据仓库中。3.根据权利要求1所述的一种基于大数据技术的业扩报装档案挖掘分析方法，其特征是：所述业扩报装档案数据挖掘处理方法采用组合预测模型对数据进行处理，获取档案数据中的深层次关系；神经网络组合器选择输入层、隐层和输出层三层BP网络结构，采用Sigmoid函数作为激活函数；采用自适应学习率的改进BP算法，学习率调整公式为：
ꢀꢀꢀꢀꢀ
（1）在公式（1）中，η(k）是步骤的学习速率；e(k）是网络的k阶跃误差，在调整学习速率时，首先检查权重的校正是否能够减小误差函数；如果误差减小，则学习率太小，应适当提高；否则，应降低学习速度，使学习速度随误差而变化，使学习步长增长并趋于稳定，加快神经网络的收敛速度；具体计算步骤如下：（1）读取神经网络的结构信息和数据信息；
（2）初始化神经网络的隐层权重V
p
、输出层权重W
p
、隐层权重Ψ、输出层阈值φ、分配给的随机值[
‑
1,1]、学习率和动量因子的初始值；（3）输入样本数据，输入输出数据规范化；（4）选择一个样本；实际输出y,对网络的输出进行了正向计算，并给出了输出h
p
的计算公式，网络的实际输出是向前计算的，隐藏层和输出层的输出y
i
的计算公式如下：
ꢀꢀꢀ
(2)公式（2）中f(x)为S形函数；m为隐藏层节点数，通过经验公式检验隐藏层数，确定：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)在公式（3）中，p是训练样本数，是输入层的节点数，在隐藏层，采用GA...

【专利技术属性】
技术研发人员：高宁，曾玲，梁海洪，沈晓舟，张博，左越，张蓓，董阳，付临，周鑫，刘蕤，付海东，
申请(专利权)人：国网辽宁省电力有限公司国家电网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人