【技术实现步骤摘要】
一种产业招商线索发现方法、系统、设备及存储介质
[0001]本专利技术涉及线索发现
,尤其涉及一种产业招商线索发现方法、系统、设备及存储介质。
技术介绍
[0002]园区招商引资实际上是一个双向选择的过程,企业看重的不外乎产业基础、资源禀赋、区位优势等这几大因素;政府甄选企业更在乎它的发展潜力、人才潜力等。过去的招商引资,主要靠政策来吸引企业落户,现在更需要主动作为,靶向选择目标企业。所以,对于招商人员而言,没有明确的招商目标就没办法开展招商工作,如何从数以亿计的企业中精准获取具备有效性、针对性的招商目标信息成为招商引资过程中的痛点;其次是目标企业对接问题,受限于地理位置和人脉关系的原因,难以触达目标企业;接着是招商流程管控问题,主管部门因招商项目繁多无法统一部署工作,导致出勤管理及招商成果难以及时共享,业绩与考核脱节,没有形成有效竞争;最后是招商配套服务问题,项目落地缺乏人才项目资本支持,产品上下游对接难,无法激活域内企业升级。
[0003]面对传统招商模式下这些问题的,亟需创新招商引资模式。通过打造数字化招 ...
【技术保护点】
【技术特征摘要】
1.一种产业招商线索发现方法,其特征在于,所述一种产业招商线索发现方法包括以下步骤:S1,采集园区和企业多来源、多维度数据,将获取的源数据根据来源分别建立园区文本数据集和企业文本数据集,并存入数据库;继续执行步骤S2;S2,对所述源数据进行预处理,并利用TFC技术提取对应的基本特征信息,分别建立基本特征信息集合;继续执行步骤S3;S3,根据招商的意愿和实际需要,将园区和企业基本特征信息划分成不同维度的需求和意愿,分别打上对应的标签,形成园区和企业意愿分词标签集合;继续执行步骤S4;S4,根据企业和园区意愿标签分词集合,提取出对应的意愿语义信息;继续执行步骤S5;S5,利用余弦相似度算法,匹配计算园区各意愿语义信息与企业各意愿语义信息,将与某企业意愿语义信息相似度高于预设第二阈值的园区意愿语义信息对应的源数据作为有效招商线索主题。2.如权利要求1所述的一种产业招商线索发现方法,其特征在于,所述步骤S1具体包括:通过对包括园区网站、政府机构等官方网站的园区、工商企业数据、园区、企业内部CRM系统的不同公开数据源进行数据采集和清洗,获取到园区和企业的数据,其中,园区的数据包括:园区的发展定位、总体目标、重点发展产业情况、产业用地出让情况、产业项目落地情况、新增重点企业情况、产业链情况、园区政策、园区空间建设布局、重点项目建设内容、园区企业经营情况、园区企业科技创新、园区基础设施工程专项、组织架构和运营、投资时序及实施数据;企业的数据包括:企业扩展信息、技术创新信息、企业工商信息、企业投融资信息、企业人才招聘、企业财务信息数据;根据信息来源将数据分为园区文本数据集和企业文本数据集。3.如权利要求1所述的一种产业招商线索发现方法,其特征在于,所述步骤S2具体包括:对所述多来源、多维度数据进行包括中文分词、去除停用词以及非法格式字符的预处理,并使用TFC技术,计算词P在两个文本数据集中的权重,分解成可落地的数据维度:W
dP
为词P在对应源数据d中的权重,tf
dP
为词P在对应源数据d中出现的频次,N为对应文本数据集中源数据d的总数,n
P
为对应文本数据集中包含词P的源数据数量,k为源数据d中词P的个数;词P在园区文本数据集和企业文本数据集中的权重分别为最终词W
dP1
和W
dP2
,则其在所述数据库中的权重为(W
dP1
+W
dP2
)/2;将每个源数据中的分词按照在数据库中的权重由高到低排序,取排名为预设名次的分词为该数据源的对应的基本特征信息,从而得到园区文本数据集和企业文本数据集对应的基本特征信息集合。
4.如权利要求1所述的一种产业招商线索发现方法,其特征在于,所述步骤S3具体包括:根据园区基本特征信息以及企业基本特征信息,分别为园区和企业打上对应的意愿标签,并对意愿标签进行分词处理,形成园区意愿标签分词集合和企业意愿标签分词集合;园区意愿标签主要包括:产业聚集意愿、引进高技术人才意愿、引进高科技技术意愿、引进高科技企业意愿、引进创新金融机构意愿;企业意愿标签主要包括:企业扩张意愿、企业多元战略意愿、企业物流仓储意愿、企业空间发展意愿、企业科技创新意愿、企业人才战略意愿、企业合理避税意愿、企业产城融合意愿以及规模发展、品牌传播、网络效应意愿、产业基础意愿、资源禀赋意愿、区位优势意愿。5.如权利要求1所述的一种产业招商线索发现方法,其特征在于,所述步骤S4具体包括:S4
‑
1,将意愿标签分词转换为向量,采用Single
‑
pass聚类算法对所述园区意愿标签分词集合和企业意愿标签分词集合分别进行第一层聚类,得到对应的文本相似度高于预设第一阈值的多个子话题;继续执行步骤S4
‑
2;S4
‑
2,利用自底向上的层次聚类算法分别进行子话题的合并,得到园区意愿标签分词集合和企业意愿标签分词集合对应的最终话题,所述最终话题即为园区意愿语义信息和企业意愿语义信息。6.如权利要求5所述的一种产业招商线索发现方法,其特征在于,所述步骤S4
‑
1具体包括:S4
‑1‑
1,接收一个意愿标签分词向量d
i
,判断是否为第一个意愿标签分词向量,若是则执行步骤S4
‑1‑
2;若不是则执行步骤S4
‑1‑
3;S4
‑1‑
2,创建一个子话题,将意愿标签分词向量d
i
归入此子话题,继续执行步骤S4
‑1‑
3;S4
‑1‑
3,根据Sim
i,j
=λ*Sim
vsm
(d
i
,d
j
)+(1
‑
λ)*Sim
LDA
(d
i
,d
j
),计算d
i
与每一个子话题向量d
j
分别之间的相似度值Sim
i,j
【专利技术属性】
技术研发人员:杜登伟,杜登斌,杜乐,杜小军,
申请(专利权)人:武汉东湖大数据交易中心股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。