System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种中小微企业规模及行业特性自适应划分方法技术_技高网

一种中小微企业规模及行业特性自适应划分方法技术

技术编号:40700593 阅读:2 留言:0更新日期:2024-03-22 10:58
本发明专利技术公开了一种中小微企业规模及行业特性自适应划分方法,包括以下步骤:S1:选取影响中小微企业用电习惯的主要影响因素及负荷数据;对选取的影响因素及负荷数据进行数据预处理得到历史数据集;S2:将S1中预处理后的历史数据集作为训练数据集训练随机森林算法建立分类模型,利用灰狼优化算法对随机森林算法中的单棵决策树的最大特征数和决策树数目这两个超参数进行迭代寻优;S3:将最优参数输入进随机森林算法中,建立基于GWO‑RF的分类模型;S4:输入数据,基于GWO‑RF的分类模型对新的数据集进行判别和分类,通过判别和分类结果对中小微企业规模及行业特性自适应划分,可以提升数据决策能力,增强政府的数据支撑,还能助力改善营商环境。

【技术实现步骤摘要】

本专利技术涉及数据挖掘,具体为一种中小微企业规模及行业特性自适应划分方法


技术介绍

1、在中小微企业数据分析的全环节,由于行业差异、地域差异、规模划分困难等原因,通常会存在中小微企业规模及行业特性划分不够精确、数据分析误差大的问题进一步影响后期决策及政策开展。开展中小微企业规模及行业特性自适应划分方法研究,可充分、提高中小微企业的经营效益,进而提升数据决策能力,增强政府的数据支撑,助力改善营商环境。随着中小微企业数据监测需求的不断增加,数字电网建设的快速发展,电力数据资源急剧增长,蕴含着丰富的信息资源,可根据中小微企业的用电时间、用电行为、用电量等用电数据对中小微企业规模及行业特性划分。

2、随机森林(rf):2001年,美国科学家breiman提出随机森林算法(random forest,rf)概念。随机森林算法一般用于对目标样本进行分类或者回归运算,两种不同的功能主要区别在于算法输出不同。在回归算法模型中,输出的一般是将一棵决策树的输出经过简单平均后的结果:而分类算法则不同,是基于基本的多数投票法得到算法结果。如图2所示,随机森林的基本原理可以概括为三个步骤:随机采样、随机选特征、多数表决。

3、1)随机采样

4、随机森林的第一步是随机采样,即对训练数据集进行有放回的抽样。假设训练数据集大小为n,则从n个数据中选择n个数据组成一个新的训练集。这个新的训练集是从原始数据中有放回地随机选取的即同一个数据可以在新训练集中出现多次,也有可能从原数据集中没有选中。随机采样的目的是通过多个随机子集的平均值来减小过拟合的风险,可以提高模型对新数据的泛化能力。

5、2)随机选特征

6、随机选择特征是指在构建每颗决策树的过程中,随机从原始特征集合中选择一部分特征来训练模型具体来说,如果原始特征维度为m,那么在构建每个决策树模型时,从m个特征中随机选择r(r<<m)个特征来进行模型的训练,这一过程称之为特征随机选择。特征随机选择的目的是为了减小过拟合风险。由于每棵决策树使用的特征不同,使得不同的决策树具有不同的特点。同时,特征选择也可以降低模型方差,提高模型预测的泛化能力。

7、3)多数表决

8、随机森林的最终预测结果是由所有决策树的结果综合得出的。对于分类问题,每个决策树会输出一个分类标签,随机森林对所有决策树输出的的分类标签进行多数投票,以得出最终的分类结果。对于回归问题,每颗树输出的回归结果进行平均操作,得出随机森林的输出结果,现有的随机森林算法。

9、灰狼优化算法(gwo)是一种群智能算法,模拟了mirjalili等人提出的自然界中灰狼的领导阶层和捕猎机制,并通过与其它4种著名的元启发式算法(粒子群算法、引力搜索算法、差分进化算法和快速进化规划算法)在29个测试函数上的对比仿真实验,验证了它的优越性。灰狼优化算法具有良好的自组织性,而且具有易用性高,参数简单,全局搜索能力强和收敛速度快的特点。


技术实现思路

1、本专利技术的目的在于提供一种中小微企业规模及行业特性自适应划分方法,以解决上述
技术介绍
中提出的现有的中小微企业数据分析的全环节,由于行业差异、地域差异、规模划分困难等原因,通常会存在中小微企业规模及行业特性划分不够精确、数据分析误差大等问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种中小微企业规模及行业特性自适应划分方法,包括以下步骤:

3、s1:选取影响中小微企业用电习惯的主要影响因素及负荷数据;对选取的影响因素及负荷数据进行数据预处理得到历史数据集;

4、s2:将s1中预处理后的历史数据集作为训练数据集训练随机森林算法建立分类模型,利用灰狼优化算法对随机森林算法中的单棵决策树的最大特征数和决策树数目这两个超参数进行迭代寻优;

5、s3:将最优参数输入进随机森林算法中,建立基于gwo-rf的分类模型;

6、s4:输入数据,基于gwo-rf的分类模型对新的数据集进行判别和分类,通过判别和分类结果对中小微企业规模及行业特性自适应划分。

7、优选的是,上述s3中,应用bootstrap重抽样技术有放回的从所述历史数据集中重复随机选取与步骤2中选取的决策树数目相等数目的个子数据集,组成训练样本集合;

8、在随机森林算法每一棵树的每个结点处随机抽取,在与最大特征数数量相等的特征中选择一个最具有分类能力的变量,变量分类的阈值通过检查每一个分类点确定。

9、优选的是,上述s1中主要影响因素及负荷数据选取采用斯皮尔曼相关系数法进行。

10、优选的是,上述s1中数据预处理包括对数据做异常值处理、缺失值处理和归一化处理。

11、优选的是,通过箱线图对数据异常值进行识别异常值处理;通过拉格朗日插值法对数据进行缺失值处理;通过min-max标准化方式进行数据归一化处理。

12、优选的是,在现有灰狼优化算法的基础上引入非线性的收敛因子来控制搜索过程形成改进灰狼优化算法,采用改进灰狼优化算法对随机森林算法中的单棵决策树的最大特征数和决策树数目这两个超参数进行迭代寻优建立基于igwo-rf的分类模型。

13、优选的是,引入的非线性的收敛因子来控制搜索过程,其表现形式如下式所示:

14、

15、其中,α为收敛因子,αinitial代表a的初值,取值为2,αfinal代表a的终值,取值为0,t和t分别为当前迭代次数和最大迭代次数。

16、与现有技术相比,本专利技术的有益效果是:

17、1、本专利技术通过分析影响中小微企业用电习惯的影响因素,利用经过灰狼优化算法优化后的随机森林算法建立基于gwo-rf的中小微企业规模及行业特性自适应划分方法,可以提升数据决策能力,增强政府的数据支撑,还能助力改善营商环境。

18、2、本专利技术通过对现有的灰狼优化算法进行优化形成改进灰狼算法,利用改进灰狼优化算法对随机森林算法进行优化能够增强随机森林算法模型的分类精确度。

本文档来自技高网...

【技术保护点】

1.一种中小微企业规模及行业特性自适应划分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,上述S3中,应用bootstrap重抽样技术有放回的从所述历史数据集中重复随机选取与步骤2中选取的决策树数目相等数目的个子数据集,组成训练样本集合;

3.根据权利要求1所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,上述S1中主要影响因素及负荷数据选取采用斯皮尔曼相关系数法进行。

4.根据权利要求1所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,上述S1中数据预处理包括对数据做异常值处理、缺失值处理和归一化处理。

5.根据权利要求4所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,通过箱线图对数据异常值进行识别异常值处理;通过拉格朗日插值法对数据进行缺失值处理;通过min-max标准化方式进行数据归一化处理。

6.根据权利要求1所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,在现有灰狼优化算法的基础上引入非线性的收敛因子来控制搜索过程形成改进灰狼优化算法,采用改进灰狼优化算法对随机森林算法中的单棵决策树的最大特征数和决策树数目这两个超参数进行迭代寻优建立基于IGWO-RF的分类模型。

7.根据权利要求6所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,引入的非线性的收敛因子来控制搜索过程,其表现形式如下式所示:

...

【技术特征摘要】

1.一种中小微企业规模及行业特性自适应划分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,上述s3中,应用bootstrap重抽样技术有放回的从所述历史数据集中重复随机选取与步骤2中选取的决策树数目相等数目的个子数据集,组成训练样本集合;

3.根据权利要求1所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,上述s1中主要影响因素及负荷数据选取采用斯皮尔曼相关系数法进行。

4.根据权利要求1所述的一种中小微企业规模及行业特性自适应划分方法,其特征在于,上述s1中数据预处理包括对数据做异常值处理、缺失值处理和归一化处理。

5.根据权...

【专利技术属性】
技术研发人员:禹加李雍睿杨朔李占军王勇王占营
申请(专利权)人:国网辽宁省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1