企业外迁风险预测方法、装置及计算机可读存储介质制造方法及图纸

技术编号:33950034 阅读:12 留言:0更新日期:2022-06-29 22:13
本发明专利技术公开了一种企业外迁风险预测方法、装置及计算机可读存储介质,包括:获取企业外迁信息数据集,所述企业外迁信息数据集中包含多条企业数据,每一企业数据包含相应企业的外迁状态以及多个企业特征;对所述企业外迁信息数据集进行向量化处理,得到与所述企业数据一一对应的多个样本数据;根据所述样本数据构建企业外迁决策树;当评估目标企业是否存在外迁风险时,将所述目标企业的企业特征输入所述企业外迁决策树以获取所述目标企业的外迁风险预测结果。与现有技术相比,本发明专利技术实现了利用决策树的机器学习进行企业外迁风险预测,其大大降低了人工识别的工作量,同时避免了人工误判,通过大数据的机器学习能够大幅度提高预测结果的准确度。结果的准确度。结果的准确度。

【技术实现步骤摘要】
企业外迁风险预测方法、装置及计算机可读存储介质


[0001]本专利技术涉及风险评估
,尤其涉及一种企业外迁风险预测方法、装置及计算机可读存储介质。

技术介绍

[0002]企业迁移是企业发展与成长过程中对资源、要素、市场、环境等做出的一种综合选择,是市场经济发展到一定阶段的必然产物。对于一些制造业企业,其受扩张需要、综合营商成本上升、其他城市加大招商引资力度等因素影响容易进行外迁。对于某个地区而言,当部分企业外迁时,容易引发整体外迁,同时,龙头企业外迁也容易导致供应链跟随外迁的风险,进而危及产业链的完整性,给相关中小企业的发展带来巨大危机。
[0003]因此,及时识别企业外迁风险对地区的发展至关重要。而目前,市场上尚未存在有效的企业外迁风险预警机制,多是通过人工调查进行判断,而人工判断不仅工作量大,且误判率较高。

技术实现思路

[0004]有鉴于此,有必要提供一种企业外迁风险预测方法、装置及计算机可读存储介质,以解决现有技术中人工识别企业外迁风险时工作量大、准确率低的技术问题。
[0005]为实现上述目的,本专利技术一实施例提供了一种企业外迁风险预测方法,包括以下步骤:
[0006]获取企业外迁信息数据集,所述企业外迁信息数据集中包含多条企业数据,每一所述企业数据包含相应企业的外迁状态以及多个企业特征;
[0007]对所述企业外迁信息数据集进行向量化处理,得到与所述企业数据一一对应的多个样本数据;
[0008]根据所述样本数据构建企业外迁决策树;
[0009]当评估目标企业是否存在外迁风险时,将所述目标企业的企业特征输入所述企业外迁决策树以获取所述目标企业的外迁风险预测结果。
[0010]可选的,所述根据所述样本数据构建企业外迁决策树的步骤包括:
[0011]从所述样本数据中选取不完全相同的Z组样本数据,Z为大于或等于2的自然数;
[0012]根据所述Z组样本数据构建对应的Z个企业外迁决策树;
[0013]对应的,所述将所述目标企业的企业特征输入所述企业外迁决策树以获取所述目标企业的外迁风险预测结果的步骤包括:
[0014]将所述目标企业的企业特征分别输入所述Z个企业外迁决策树;
[0015]根据所述Z个企业外迁决策树输出的Z个企业外迁风险预测结果确定所述目标企业的外迁风险预测结果。
[0016]可选的,所述根据所述Z个企业外迁决策树输出的Z个企业外迁风险预测结果确定所述目标企业的外迁风险预测结果的步骤包括:
[0017]根据绝对多数投票法,将所述Z个企业外迁风险预测结果中数量超过Z/2的企业外迁风险预测结果作为所述目标企业的外迁风险预测结果。
[0018]可选的,当所述样本数据的数量为N,所述企业特征的数量为M时,所述从所述样本数据中选取不完全相同的Z组样本数据的步骤包括:
[0019]通过有放回的随机抽样方法,从所述样本数据中进行Z次随机抽样,其中每次随机抽样用于从N个所述样本数据中随机选取n个样本数据,从M个所述企业特征中随机选取m个企业特征构成一组样本数据,其中M和N为大于或等于2的自然数,n小于N且m小于M。
[0020]可选的,所述根据所述样本数据构建企业外迁决策树的步骤还包括:
[0021]判断构建Z个企业外迁决策树时得到的企业外迁风险预测结果是否满足准确率指标;
[0022]当不满足准确率指标时,新增一个企业外迁决策树;
[0023]通过Z=Z+1更新Z并重复执行所述判断构建Z个企业外迁决策树时得到的企业外迁风险预测结果是否满足准确率指标的步骤直至判断结果为是。
[0024]可选的,所述根据所述样本数据构建企业外迁决策树的步骤包括:
[0025]根据所述样本数据,通过CART分类树算法构建所述企业外迁决策树。
[0026]可选的,所述获取企业外迁信息数据集的步骤包括:
[0027]获取企业外迁数据集和企业信息数据集;
[0028]对所述企业外迁数据集和企业信息数据集进行融合处理,得到所述企业外迁信息数据集。
[0029]可选的,所述对所述企业外迁数据集和企业信息数据集进行融合处理的步骤之前还包括:
[0030]对所述企业外迁数据集和企业信息数据集进行数据清洗,所述数据清洗包括去重处理和/或缺失值处理。
[0031]本专利技术的另一实施例提供了一种企业外迁风险预测装置,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如上所述的企业外迁风险预测方法。
[0032]本专利技术的另一实施例提供了一种计算机可读存储介质,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行如上所述的企业外迁风险预测方法。
[0033]与现有技术相比,本专利技术实施例提出的企业外迁风险预测方法,首先获取企业外迁信息数据集,然后对企业外迁信息数据集进行向量化处理,得到与企业数据一一对应的多个样本数据,之后根据样本数据构建企业外迁决策树,当需要评估某一目标企业是否存在外迁风险时,将该目标企业的企业特征输入至企业外迁决策树即可获得该目标企业的外迁风险预测结果,即本专利技术实施例实现了利用决策树的机器学习进行企业外迁风险预测,其大大降低了人工识别的工作量,同时避免了人工误判,通过大数据的机器学习能够大幅度提高预测结果的准确度。
附图说明
[0034]图1为本专利技术企业外迁风险预测方法一实施例的流程图。
[0035]图2为本专利技术企业外迁风险预测装置一实施例的结构框图。
[0036]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0037]应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0038]实施例1
[0039]请参考图1,图1为本专利技术企业外迁风险预测方法一实施例的流程图。如图1所示,其包括以下步骤:
[0040]步骤S101,获取企业外迁信息数据集,企业外迁信息数据集中包含多条企业数据,每一企业数据包含相应企业的外迁状态以及多个企业特征。
[0041]具体的,获取企业外迁信息数据集的步骤包括:
[0042](1)获取企业外迁数据集和企业信息数据集。
[0043]其中,企业外迁数据集中包含企业的外迁信息,如外迁企业名称、外迁时间和外迁状态等信息,其可以通过相关政务类网站获取,如通过爬虫、人工等方式从政务类或政策类网站采集企业外迁数据集。企业信息数据集中包含企业的基本信息,如企业名称、企业类型、经营信息、更新时间等数据,其可以通过企业查询网站获取,例如也可以通过爬虫、人工等方式从企业网站或者第三方企业查询网站采集企业信息数据集。需要说明的是,进行数据采集的时候,企业外迁数据集和企业信息数据集的时间维度要保持一致,如外迁时间是当前月份的,企业信息的最后更新时间也应该是当前月份,避免两类数据在时间维度上不一致。此外,企业外迁数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业外迁风险预测方法,其特征在于,包括以下步骤:获取企业外迁信息数据集,所述企业外迁信息数据集中包含多条企业数据,每一所述企业数据包含相应企业的外迁状态以及多个企业特征;对所述企业外迁信息数据集进行向量化处理,得到与所述企业数据一一对应的多个样本数据;根据所述样本数据构建企业外迁决策树;当评估目标企业是否存在外迁风险时,将所述目标企业的企业特征输入所述企业外迁决策树以获取所述目标企业的外迁风险预测结果。2.根据权利要求1所述的企业外迁风险预测方法,其特征在于,所述根据所述样本数据构建企业外迁决策树的步骤包括:从所述样本数据中选取不完全相同的Z组样本数据,Z为大于或等于2的自然数;根据所述Z组样本数据构建对应的Z个企业外迁决策树;对应的,所述将所述目标企业的企业特征输入所述企业外迁决策树以获取所述目标企业的外迁风险预测结果的步骤包括:将所述目标企业的企业特征分别输入所述Z个企业外迁决策树;根据所述Z个企业外迁决策树输出的Z个企业外迁风险预测结果确定所述目标企业的外迁风险预测结果。3.根据权利要求2所述的企业外迁风险预测方法,其特征在于,所述根据所述Z个企业外迁决策树输出的Z个企业外迁风险预测结果确定所述目标企业的外迁风险预测结果的步骤包括:根据绝对多数投票法,将所述Z个企业外迁风险预测结果中数量超过Z/2的企业外迁风险预测结果作为所述目标企业的外迁风险预测结果。4.根据权利要求2所述的企业外迁风险预测方法,其特征在于,当所述样本数据的数量为N,所述企业特征的数量为M时,所述从所述样本数据中选取不完全相同的Z组样本数据的步骤包括:通过有放回的随机抽样方法,从所述样本数据中进行Z次随机抽样,其中每次随机抽样用于从N个所述样本数据中随机选取...

【专利技术属性】
技术研发人员:盘浩军奉凡唐明黄尉洵
申请(专利权)人:深圳中科闻歌科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1