一种基于多源数据识别园区内重点产业链节点的方法、存储介质及系统技术方案

技术编号:39046929 阅读:17 留言:0更新日期:2023-10-10 11:59
本发明专利技术提供一种基于多源数据识别园区内重点产业链节点的方法、存储介质及系统,该方法包括:从不同数据系统获取园区内各个企业的多源数据,对园区内各个企业的多源数据分别进行融合对齐处理;根据多源数据分析园区内各个企业所属的产业链及在产业链中所处的产业链节点;根据多源数据计算园区内各个企业的多项重点识别指标;根据园区内各个企业的各项重点识别指标,对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别。这样就可识别出园区内需引入企业的重点产业链节点,为园区招商过程中的企业筛选引入提供参考,提高园区招商目标与园区内的产业链适配度,以实现园区稳定有序的长期发展。园区稳定有序的长期发展。园区稳定有序的长期发展。

【技术实现步骤摘要】
一种基于多源数据识别园区内重点产业链节点的方法、存储介质及系统


[0001]本专利技术涉及数据处理
,特别涉及一种基于多源数据识别园区内重点产业链节点的方法、存储介质及系统。

技术介绍

[0002]产业集群是以中心产品为主导,以区域为聚集地,企业按产业链条的联系成群聚集在一起的现象,如何通过发展产业集群来提升区域经济竞争力是经济发展的战略性问题。园区是发展产业集群的重要环节之一,企业以产业链形式在园区中聚集,提升区域经济竞争力。园区招商作为园区建设发展的主要途径,对园区内的产业集聚和产业最终发展导向具有重要作用,但现阶段缺乏为园区招商过程中的企业筛选引入提供参考的手段,难以识别园区内需引入企业的重点产业链节点,导致园区招商目标与园区内的产业链适配度低,难以实现园区稳定有序的长期发展。

技术实现思路

[0003]本专利技术要解决的技术问题是如何识别园区内需引入企业的重点产业链节点。
[0004]为解决上述技术问题,本专利技术提供一种基于多源数据识别园区内重点产业链节点的方法,包括如下步骤:
[0005]S1.从不同数据系统获取园区内各个企业的多源数据,对园区内各个企业的多源数据分别进行融合对齐处理,其中,所述多源数据包括园区企业清单、企业基础信息数据和电力合同数据;
[0006]S2.根据所述多源数据分析园区内各个企业所属的产业链及在产业链中所处的产业链节点;
[0007]S3.根据所述多源数据计算园区内各个企业的多项重点识别指标,所述重点识别指标包括园区内各个企业的竞争水平度数、月均用电量超容值、用电业扩报装需求得分以及新入园企业的日均用电量超容值,具体包括如下步骤S31、S32、S33和S34;
[0008]S31.基于复杂网络模型,根据园区企业清单生成对应园区内各个企业的网络节点,然后根据网络节点和园区内各个企业之间的相似度构建企业相似网络,再根据所述企业相似网络分析出园区内各个企业的竞争水平度数,其中,园区内各个企业之间的相似度具体根据园区内各个企业的企业基础信息数据计算得出;
[0009]S32.根据园区内各个企业的电力合同数据计算园区内各个企业的理论月均用电量,获取园区内各个企业的实际月均用电量,将园区内各个企业的实际月均用电量与理论月均用电量进行比较得到园区内各个企业的月均用电量超容值;
[0010]S33.根据园区内各个企业在一定时间范围内的用电量或年最大负荷量,预测园区内各个企业在未来预设时间内的预计用电量和预计年最大负荷量,将预测结果分别与当前年用电量、当前年最大负荷量进行比较,根据比较结果分析园区中各个企业的用电业扩报
装需求得分;
[0011]S34.根据园区企业清单和园区内各个企业的电力合同数据识别新入园企业,并根据电力合同数据计算新入园企业的理论日均用电量,获取新入园企业的实际日均用电量,将新入园企业的实际日均用电量与理论日均用电量进行比较得到新入园企业的日均用电量超容值;
[0012]S4.根据园区内各个企业的各项重点识别指标,对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别,具体包括如下步骤S41、S42和S43;
[0013]S41.计算各个产业链节点的各项重点识别指标均值;
[0014]S42.根据园区内各个企业的各项重点识别指标均值对园区内各个企业所属的产业链节点进行聚类分析,从而将所有产业链节点划分为预设数量的不同类别;
[0015]S43.获取聚类分析后每个类别中的所有产业链节点的各项重点识别指标均值,根据获取结果对每个类别进行重点产业链节点识别并生成对应的可视化标签。
[0016]优选地,所述步骤S42包括:
[0017]S421.根据业务需求先初拟最终需要对所有产业链节点进行聚类的类别个数;
[0018]S422.将各个类别的簇心随机定义在不同的产业链节点上;
[0019]S423.计算非簇心产业链节点到各个簇心的连续型分类因子距离;
[0020]S424.计算非簇心产业链节点到各个簇心的离散型分类因子距离;
[0021]S425.根据所述连续型分类因子距离和所述离散型分类因子距离计算非簇心产业链节点到各个簇心的距离;
[0022]S426.找出每个非簇心产业链节点到各个簇心的距离当中的最小值,然后将每个非簇心产业链节点关联到距离最近的簇心所属的类别上;
[0023]S427.将全部非簇心产业链节点关联到距离最近的簇心所属的类别上之后,将每个簇心与其所关联的所有非簇心产业链节点形成一个簇;
[0024]S428.不断重复上述步骤S423至S427,直至在确定所有簇的新簇心时,所有新簇心的变化距离都不小于预设阈值,再以所有新簇心及其所关联的非簇心产业链节点作为最终聚类结果,形成对应的类别。
[0025]优选地,所述步骤S31中,运用余弦相似度算法计算得出园区内各个企业之间的相似度,具体计算公式如下:
[0026][0027]其中,cos(θ)表示不同企业之间的相似度;d表示对应企业基础信息数据的维度数;x
i
、y
i
分别表示不同企业的第i个维度数据。
[0028]优选地,所述步骤S31中,若两个企业之间的相似度超过一定阈值,则在这两个企业分别对应的两个网络节点之间建立起一条连接边,使得所有网络节点及网络节点之间建立起的连接边构建成为企业相似网络。
[0029]优选地,所述步骤S31中,根据企业相似网络中每个网络节点的连接边数量分析出园区内各个企业的竞争水平度数。
[0030]优选地,所述步骤S43中,根据每个类别中的所有产业链节点的重点产业链节点综
合评价指数、企业月均用电量超容值均值、企业用电业扩报装需求得分均值、新入园企业日均用电量超容值均值计算重点产业链节点综合评价指数,其中,企业竞争水平度数均值越小、企业月均用电量超容值均值越大、企业用电业扩报装需求得分均值越大、新入园企业的日均用电量超容值均值越小,则对应类别的重点产业链节点综合评价指数越大,越要将该类别中的产业链节点识别为重点产业链节点。
[0031]本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行是,实现如上所述的基于多源数据识别园区内重点产业链节点的方法中的步骤。
[0032]本专利技术还提供一种基于多源数据识别园区内重点产业链节点的系统,包括相互连接的处理器和如上所述的计算机可读存储介质。
[0033]本专利技术具有以下有益效果:本专利技术根据融合对齐处理后的多源数据计算园区内各个企业的多项重点识别指标,然后根据园区内各个企业的各项重点识别指标对园区内各个企业对应的产业链节点进行聚类分析及重点产业链节点识别,这样就可识别出园区内需引入企业的重点产业链节点,为园区招商过程中的企业筛选引入提供参考,提高园区招商目标与园区内的产业链适配度,以实现园区稳定有序的长期发展。
附图说明
[0034]图1是基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多源数据识别园区内重点产业链节点的方法,其特征是,包括如下步骤:S1.从不同数据系统获取园区内各个企业的多源数据,对园区内各个企业的多源数据分别进行融合对齐处理,其中,所述多源数据包括园区企业清单、企业基础信息数据和电力合同数据;S2.根据所述多源数据分析园区内各个企业所属的产业链及在产业链中所处的产业链节点;S3.根据所述多源数据计算园区内各个企业的多项重点识别指标,所述重点识别指标包括园区内各个企业的竞争水平度数、月均用电量超容值、用电业扩报装需求得分以及新入园企业的日均用电量超容值,具体包括如下步骤S31、S32、S33和S34;S31.基于复杂网络模型,根据园区企业清单生成对应园区内各个企业的网络节点,然后根据网络节点和园区内各个企业之间的相似度构建企业相似网络,再根据所述企业相似网络分析出园区内各个企业的竞争水平度数,其中,园区内各个企业之间的相似度具体根据园区内各个企业的企业基础信息数据计算得出;S32.根据园区内各个企业的电力合同数据计算园区内各个企业的理论月均用电量,获取园区内各个企业的实际月均用电量,将园区内各个企业的实际月均用电量与理论月均用电量进行比较得到园区内各个企业的月均用电量超容值;S33.根据园区内各个企业在一定时间范围内的用电量或年最大负荷量,预测园区内各个企业在未来预设时间内的预计用电量和预计年最大负荷量,将预测结果分别与当前年用电量、当前年最大负荷量进行比较,根据比较结果分析园区中各个企业的用电业扩报装需求得分;S34.根据园区企业清单和园区内各个企业的电力合同数据识别新入园企业,并根据电力合同数据计算新入园企业的理论日均用电量,获取新入园企业的实际日均用电量,将新入园企业的实际日均用电量与理论日均用电量进行比较得到新入园企业的日均用电量超容值;S4.根据园区内各个企业的各项重点识别指标,对园区内各个企业所处的产业链节点进行聚类分析及重点产业链节点识别,具体包括如下步骤S41、S42和S43;S41.计算各个产业链节点的各项重点识别指标均值;S42.根据园区内各个企业的各项重点识别指标均值对园区内各个企业所属的产业链节点进行聚类分析,从而将所有产业链节点划分为预设数量的不同类别;S43.获取聚类分析后每个类别中的所有产业链节点的各项重点识别指标均值,根据获取结果对每个类别进行重点产业链节点识别并生成对应的可视化标签。2.根据权利要求1所述的基于多源数据识别园区内重点产业链节点的方法,其特征是,所述步骤S42包括:S421.根据业务需求先初拟最终需要对所有产业链节点进行聚类的类别个数;S422.将各个类别的簇心随机定义在不同的产业链节点上;S423.计算非簇...

【专利技术属性】
技术研发人员:曹熙赵永国蔡露程菊花余建纯李文杰曾祥清胡彩倩倪沛权王雪纯韩庭钰戴渝卓
申请(专利权)人:南方电网大数据服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1