【技术实现步骤摘要】
基于电力大数据的企业经营状况评估方法
本专利技术属于电力大数据应用
,涉及基于电力大数据的企业经营状况评估技术。
技术介绍
大数据技术将推动信息技术平台的升级与改造,补充对非结构化数据分析与利用的能力,增强对海量数据资源的价值挖掘能力。电力大数据是电力公司的新型资产,能够促进电力公司的业务管理向更精细、更高效的方向发展。电力大数据中蕴藏了丰富的与用电企业相关的信息。对电力大数据进行分析,可以挖掘出潜藏在电力大数据中的企业经营状况。随着近来数据可用性,算力和新算法的快速发展,机器学习已逐渐成为实现人工智能(AI)的关键方法之一。机器学习是计算机科学更广泛领域中人工智能的一个子集。它用计算机和算法从“数据”中学习并发现“模式和洞察”,因为在许多情况下,“模式和洞察”就隐藏在“数据”之中。随着时代发展,从业务流程中积累的数据对人类来说理解起来可能非常复杂。然而算法却能够比人更快、更准确地从数据中发掘出“模式和洞察”。国网甘肃省电力公司兰州供电公司提出了《综合电力用户缴费指标和行业公开指标的电力用户信用评价方法 ...
【技术保护点】
1.一种基于电力大数据的企业经营状况评估方法,其特征在于包括以下步骤:/nS1数据预处理/n依据企业的与用电相关的若干数据集,过滤掉缺少数据集的企业样本,同时对数据集中样本缺失值、零值进行处理。/nS2分级特征提取/n从预处理的数据集中提取若干用于表征企业用电信息的若干二级维度特征,然后依据二级维度特征,通过孤立森林异常检测算法得到用于表征企业用电信息异常程度的一级维度特征;该步骤包括以下分步骤:/nS21依据二级维度特征计算逻辑,从预处理后的数据集中提取二级维度特征值,并对提取的二级维度特征值进行归一化处理;/nS22依据归一化处理后的二级维度特征值,通过孤立森林异常检测 ...
【技术特征摘要】
1.一种基于电力大数据的企业经营状况评估方法,其特征在于包括以下步骤:
S1数据预处理
依据企业的与用电相关的若干数据集,过滤掉缺少数据集的企业样本,同时对数据集中样本缺失值、零值进行处理。
S2分级特征提取
从预处理的数据集中提取若干用于表征企业用电信息的若干二级维度特征,然后依据二级维度特征,通过孤立森林异常检测算法得到用于表征企业用电信息异常程度的一级维度特征;该步骤包括以下分步骤:
S21依据二级维度特征计算逻辑,从预处理后的数据集中提取二级维度特征值,并对提取的二级维度特征值进行归一化处理;
S22依据归一化处理后的二级维度特征值,通过孤立森林异常检测算法得到相应的一级维度特征值;
S3将各企业的所有一级维度特征值相加得到企业的总异常得分,然后依据给定的标准,判定企业是否经营状况异常,若是则进入步骤S4;若不是,则企业经营状况正常;
S4将所有经营状况异常的企业,通过聚类算法得到经营状况良好的企业和经营状况较差的企业。
2.根据权利要求1所述基于电力大数据的企业经营状况评估方法,其特征与用电相关的若干数据集包括企业安全基础用电信息数据集、企业用电量数据集、企业结算电量电费数据集、企业应收电费数据集。
3.根据权利要求1所述基于电力大数据的企业经营状况评估方法,其特征在于步骤S22包括以下分步骤:
S221利用各企业归一化处理后的所有二级维度特征值构建训练集,然后利用构建的训练集对孤立森林异常检测模型进行训练得到由若干孤立树组成的孤立森林异常检测模型;
S222遍历各企业,将企业与各一级维度特征相关联的归一化处理后的二级维度特征值输入到训练好的孤立森林异常检测模型中,得到该企业的一级维度特征值。
4.根据权利要求3所述基于电力大数据的企业经营状况评估方法,其特征在于一个孤立树的构建过程包括以下分步骤:
S2211从训练集中每个二级维度特征中随机抽取,共抽取条数据样本构建孤立树训练子集;
S2212从孤立树训练子集中随机选取一个二级维度特征,并在这个特征的所有值范围内随机选一个值,对样本进行二叉划分,将样本中小于该值的划分到节点左边,大于等于该值的划分到节点的右边,得到一个分裂条件和左右两边的数据集;分别在左右两边的数据集上重复上面过程,直至达到终止条件;终止条件包括以下两项:
1)数据本身不可再分(只包含一个样本,或者全部样本都相同);
2)孤立树的高度达到
5.根据权利要求4所述基于电力大数据的企业经营状况评估方法,其特征在于步骤S222中,按照以下公式得到企业样本一级维度特征参数对应的异常得分:
式中,x表示企业样本一级维度特征参数对应的归一化后二级维度特征参...
【专利技术属性】
技术研发人员:王茂宁,邹开欣,钟羽中,邓霖,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。