System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及企业迁移预警,尤其涉及一种基于stacking模型融合的企业迁移预警方法、系统及电子设备。
技术介绍
1、企业迁移是区域产业转移的微观体现,对迁出地和迁入地产生不同的影响。对迁出地来说,企业迁出会造成税收减少、产业链转移,甚至严重可能影响会当地的结构调整与产业升级;而对于迁入地,企业迁入会带来税收增加、活力提升,甚至可能会形成新的经济增长极。因此,对企业迁移进行监测预警是迁出地政府安商稳商的重要抓手,也可以成为迁入地招商引资的重要线索,具有极高的实践价值。
2、在现有的企业迁移预警技术中,存在以下缺点:1.现有的企业迁移预警方法在企业迁移行为影响因素的考虑上缺少系统性梳理;2.在数据来源上,现有研究成果数据来源较为多样,包括运营商数据、能耗数据、用地数据、政策数据、企业数据等,然而,运营商数据、能耗数据获取难度较大,对于模型的广泛推广复制存在阻碍。因此,充分考虑企业迁移的影响因素,利用多源大数据挖掘历史迁移企业的数据规律,对企业外迁的进行精准预测是亟需解决的问题。
技术实现思路
1、本申请的主要目的在于克服现有技术的缺点与不足,提供一种基于stacking模型融合的企业迁移预警方法、系统及电子设备,采用逻辑回归方式对多个分类模型分类结果进行融合,使得预测企业迁移概率值的效果更加显著。
2、为了达到上述目的,本申请采用以下技术方案:
3、第一方面,本申请提供了一种基于stacking模型融合的企业迁移预警方法,包括下述步骤:
5、对所述预处理后的数据特征进行特征筛选,得到筛选后的特征;
6、将所述筛选后的特征分别输入多个预先设立的分类预测模型,得到多个企业迁移第一预测结果;
7、将所述多个企业迁移第一预测结果作为特征向量输入预先设立的逻辑回归模型中进行融合,得到企业迁移第二预测结果;
8、对所述企业迁移第二预测结果进行分数映射,根据映射后的分数对企业迁移进行预警。
9、作为优选的技术方案,所述企业数据发生整体迁移的企业数据和未发生迁移的企业数据;
10、将所述发生整体迁移的企业数据划分为正类样本,所述未发生迁移的企业数据划分为负类样本。
11、作为优选的技术方案,对所述负类样本进行欠采样,使正类样本和负类样本达到预设的比例值。
12、作为优选的技术方案,所述预处理,包括:
13、对所述企业数据特征进行向量化处理,得到向量化企业数据特征,并填充所述向量化企业数据特征中的缺失值。
14、作为优选的技术方案,所述特征筛选采用结合递归消除法与叠加投票法的方式,具体的:
15、对企业数据特征顺序进行打乱,采用随机森林模型提供的特征重要性对特征逐个剔除操作,直到达到预设的特征数量;
16、重复多次剔除筛选步骤,统计每次筛选后的特征,将特征出现的次数作为特征的重要性指标。
17、所述分类预测模型,具体的:
18、对所述筛选后的特征划分为训练集和测试集;
19、作为优选的技术方案,利用训练集分别训练分类预测模型,得到训练好的分类预测模型;
20、利用测试集测试所述训练好的分类预测模型,并对分类预测模型进行不断优化,从而得到最优的分类预测模型。
21、作为优选的技术方案,所述分类预测模型包括基于随机森林的分类预测模型、基于支持向量机分类预测模型以及基于决策树的分类预测模型。
22、作为优选的技术方案,所述对所述企业迁移第二预测结果进行分数映射是根据正态分布进行分数映射的。
23、第二方面,本申请提供了一种基于stacking模型融合的企业迁移预警系统,应用于所述的基于stacking模型融合的企业迁移预警方法,包括预处理模块、特征筛选模块、第一预测结果模块、第二预测结果模块以及预警模块;
24、所述预处理模块,用于收集企业数据特征,对所述企业数据特征进行预处理,得到预处理后的数据特征;
25、所述特征筛选模块,用于对所述预处理后的数据特征进行特征筛选,得到筛选后的特征;
26、所述第一预测结果模块,用于将所述筛选后的特征分别输入多个预先设立的分类预测模型,得到多个企业迁移第一预测结果;
27、所述第二预测结果模块,用于将所述多个企业迁移第一预测结果作为特征向量输入预先设立的逻辑回归模型中进行融合,得到企业迁移第二预测结果;
28、所述预警模块,用于对所述企业迁移第二预测结果进行分数映射,根据映射后的分数对企业迁移进行预警。
29、第三方面,本申请提供了一种电子设备,所述电子设备包括:
30、至少一个处理器;以及,
31、与所述至少一个处理器通信连接的存储器;其中,
32、所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于stacking模型融合的企业迁移预警方法。
33、综上所述,与现有技术相比,本申请提供的技术方案带来的有效效果至少包括:
34、本申请提出了一种基于stacking模型融合的企业迁移预警方法,通过收集企业数据特征,对企业数据特征进行预处理,得到预处理后的数据特征;对预处理后的数据特征进行特征筛选,得到筛选后的特征;将筛选后的特征分别输入多个预先设立的分类预测模型,得到多个企业迁移第一预测结果;将多个企业迁移第一预测结果作为特征向量输入预先设立的逻辑回归模型中进行融合,得到企业迁移概率值;对企业迁移概率值进行分数映射,根据映射后的分数对企业迁移进行预警。本申请将企业迁移问题转化为数学上分类问题,并建立分类模型,抛弃采用单一分类器模型的做法,并选择采用逻辑回归方式对多个分类器模型的分类结果进行融合,使得预测企业迁移概率值的效果更加显著。
本文档来自技高网...【技术保护点】
1.一种基于Stacking模型融合的企业迁移预警方法,其特征在于,包括下述步骤:
2.根据权利要求1所述基于Stacking模型融合的企业迁移预警方法,其特征在于,所述企业数据特征包括发生整体迁移的企业数据特征和未发生迁移的企业数据特征;
3.根据权利要求2所述基于Stacking模型融合的企业迁移预警方法,其特征在于,对所述负类样本进行欠采样,使正类样本和负类样本达到预设的比例值。
4.根据权利要求1所述基于Stacking模型融合的企业迁移预警方法,其特征在于,所述预处理,包括:
5.根据权利要求1所述基于Stacking模型融合的企业迁移预警方法,其特征在于,所述特征筛选采用结合递归消除法与叠加投票法的方式,具体的:
6.根据权利要求1所述基于Stacking模型融合的企业迁移预警方法,其特征在于,所述分类预测模型,具体的:
7.根据权利要求6所述基于Stacking模型融合的企业迁移预警方法,其特征在于,所述分类预测模型包括基于随机森林的分类预测模型、基于支持向量机分类预测模型以及基于决策树的分类预
8.根据权利要求1所述基于Stacking模型融合的企业迁移预警方法,其特征在于,所述对所述企业迁移第二预测结果进行分数映射是根据正态分布进行分数映射的。
9.基于Stacking模型融合的企业迁移预警系统,其特征在于,应用于权利要求1-8中任一项所述的基于Stacking模型融合的企业迁移预警方法,包括预处理模块、特征筛选模块、第一预测结果模块、第二预测结果模块以及预警模块;
10.一种电子设备,其特征在于,所述电子设备包括:
...【技术特征摘要】
1.一种基于stacking模型融合的企业迁移预警方法,其特征在于,包括下述步骤:
2.根据权利要求1所述基于stacking模型融合的企业迁移预警方法,其特征在于,所述企业数据特征包括发生整体迁移的企业数据特征和未发生迁移的企业数据特征;
3.根据权利要求2所述基于stacking模型融合的企业迁移预警方法,其特征在于,对所述负类样本进行欠采样,使正类样本和负类样本达到预设的比例值。
4.根据权利要求1所述基于stacking模型融合的企业迁移预警方法,其特征在于,所述预处理,包括:
5.根据权利要求1所述基于stacking模型融合的企业迁移预警方法,其特征在于,所述特征筛选采用结合递归消除法与叠加投票法的方式,具体的:
6.根据权利要求1所述基于stacking...
【专利技术属性】
技术研发人员:郝新华,韦长传,卢盛羽,方声泰,马占飞,谢晓宇,
申请(专利权)人:广州市城市规划勘测设计研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。