一种基于未来产业企业的三网产业图谱构建方法及系统技术方案

技术编号:38683777 阅读:68 留言:0更新日期:2023-09-02 22:56
本发明专利技术涉及图谱构建领域,一种基于未来产业企业的三网产业图谱构建方法,包括:构建企业三网产业数据源层,根据所述企业三网产业数据源层获取企业信息,所述企业三网产业数据源层包括企业数据源网、行业数据源网与产业数据源网;根据所述企业信息建立三网产业数据库,将所述三网产业数据库与国民经济行业、企业产出融合;根据所述三网产业数据库构建三网产业图谱,所述构建三网产业图谱包括企业构建、多维构建与人工干预构建;根据所述三网产业图谱预测企业发展动向。本发明专利技术可以预测企业所在行业的发展趋势和行业规模,发现企业的风险和价值,面向投融资和产业规划等实际应用场景提供服务。服务。服务。

【技术实现步骤摘要】
一种基于未来产业企业的三网产业图谱构建方法及系统


[0001]本专利技术涉及图谱构建领域,尤其涉及一种基于未来产业企业的三网产业图谱构建方法及系统。

技术介绍

[0002]近年来,区域产业的发展一直是国家的重点发展目标。目前国家的区域产业政策的发展主要依靠每5年发布一次的产业投入产出表和各地区的统计数据,基于投入产出数据构建有向图,通过确定阈值以提取强关联关系并构建产业复杂网络,实现对区域产业关联进行分析。这类方法可以较为准确的统计出各个地区的产业发展现状。
[0003]专利文件(CN111159426A)公开了一种基于图卷积神经网络的产业图谱融合方法,基于构建的若干产业子图谱,通过构建图谱的局部实体子图,利用图谱中的属性三元组的属性嵌入将实体的结构嵌入转换到相同的向量空间当中,形成实体嵌入向量,将实体对齐问题转换为图匹配的问题,进一步利用图注意力的方法,形成局部匹配向量,在通过GCN使局部匹配信息在图中传播,形成图级的匹配向量,最终通过一个双层的前馈神经网络得到图谱中实体对齐。本专利技术通过属性嵌入将实体的结构嵌入转换到相同向量空间中,缓解了预对齐实体不足的问题,进一步利用图注意力将图谱中实体对齐问题转化为图匹配问题。为优化产业结构,优化区域结构,提升产业核心竞争力,提供了智力支持,但是该方法无法解决预测企业所在行业的发展趋势和行业规模,发现企业的风险和价值,面向投融资和产业规划等实际应用场景提供服务。

技术实现思路

[0004]本专利技术提供一种基于未来产业企业的三网产业图谱构建方法及系统,其主要目的在于可以预测企业所在行业的发展趋势和行业规模,发现企业的风险和价值,面向投融资和产业规划等实际应用场景提供服务。
[0005]为实现上述目的,本专利技术提供的一种基于未来产业企业的三网产业图谱构建方法,包括:构建企业三网产业数据源层,根据所述企业三网产业数据源层获取企业信息,所述企业三网产业数据源层包括企业数据源网、行业数据源网与产业数据源网,所述企业数据源网、行业数据源网与产业数据源网均分别包括研究报告、互联网新闻、上市公司披露文本中的大量行业实体、关系和元素数据;根据所述企业信息建立三网产业数据库,将所述三网产业数据库与国民经济行业、企业产出融合;根据所述三网产业数据库构建三网产业图谱,所述构建三网产业图谱包括企业构建、多维构建与人工干预构建;根据所述三网产业图谱预测企业发展动向。
[0006]可选地,所述企业构建包括:
根据企业的产业链上中下游的细分行业确定企业的主营业务;若所述企业的主营业务属于细分行业,则将所述企业信息纳入所述企业构建中;若所述企业的主营业务不属于细分行业,则将所述企业信息进行筛除;获取所述企业的主营业务的产业链要素,所述产业链要素包括行业定义、竞争格局、历史与趋势、行业规模,获得所述企业构建结果。
[0007]可选地,所述多维构建包括:构建多维训练模型,设定所述企业数据源网、行业数据源网与产业数据源网分别为矩阵X、Y、Z,表达式为:其中,X、Y、Z方分别表示企业数据源网、行业数据源网与产业数据源网的信息的集合,表示为企业数据源网、行业数据源网之间的信息权值,表示为行业数据源网的维度值;通过所述多维训练模型对所述企业数据源网、行业数据源网与产业数据源网的信息进行训练,获取所述企业数据源网、行业数据源网与产业数据源网的信息特征,对所述信息特征进行分类。
[0008]可选地,所述对所述信息特征进行分类,包括:将所述企业数据源网、行业数据源网与产业数据源网的信息提取成信息文本;标记所述信息文本的关键词,对所述信息文本的关键词进行标号,获得所述信息文本的关键词的ID;将所述信息文本的关键词的ID输入到所述多维训练模型中进行训练,获取所述企业数据源网、行业数据源网与产业数据源网的信息的分类结果,确定所述分类结果与所述企业的主营业务之间的联系。
[0009]可选地,所述确定所述分类结果与所述企业的主营业务之间的联系,包括:获取所述企业的主营业务的实体,将所述企业的主营业务的实体设定为矩阵,抽取所述分类结果中的信息与所述企业的主营业务的实体进行关联,表达式为:其中,表示为分类结果中的信息与企业的主营业务的实体的关联值,分别表示企业的主营业务的任意三个实体,表示为分类结果中的任意信息,表示分类结果中的信息与企业的主营业务的实体进行关联系数;若为负值时,则分类结果中的信息与企业的主营业务的实体之间不存在关联;若为正值时,则分类结果中的信息与企业的主营业务的实体之间存在关联,获得关联信息,将所述关联信息与企业的主营业务的实体进行融合。
[0010]可选地,所述将所述关联信息与企业的主营业务的实体进行融合,包括:对所述关联信息与企业的主营业务的实体进行编码,同时设定同一行业、同一企业与同一产业的编码号;将所述关联信息与企业的主营业务的实体的编码与同一行业、同一企业与同一产
业的编码号进行融合,将所述关联信息放入到对应的同一行业、同一企业与同一产业的编码号中,将所述企业的主营业务的实体放入到同一企业中,获得多维构建结果。
[0011]可选地,所述人工干预构建,包括:将所述多维构建中未识别的企业数据源网、行业数据源网与产业数据源网的信息,通过人工干预识别,将不属于企业数据源网、行业数据源网与产业数据源网的信息进行删除,将属于企业数据源网、行业数据源网与产业数据源网的信息送入所述多维构建中,获得人工干预构建结果。
[0012]可选地,将所述企业构建结果、多维构建结果与人工干预构建结果形成三网产业图谱。
[0013]可选地,所述根据所述三网产业图谱预测企业发展动向,包括:将所述企业构建结果、多维构建结果与人工干预构建结果分别表示;根据所述三网产业图谱预测企业发展动向,表达式为:其中,,表示企业构建结果、多维构建结果之间关系系数,表示多维构建结果与人工干预构建结果之间的关系系数,表示企业构建结果与人工干预构建结果之间的关系系数。
[0014]一种基于未来产业企业的三网产业图谱构建系统,其特征在于,包括:数据源构建模块,用于构建企业三网产业数据源层,根据企业三网产业数据源层获取企业信息;企业数据库建立模块,用于根据企业信息建立三网产业数据库,将三网产业数据库与国民经济行业、企业产出融合;三网产业图谱构建模块,用于根据三网产业数据库构建三网产业图谱,所述构建三网产业图谱包括企业构建、多维构建与人工干预构建;三网产业预测模块,用于根据三网产业图谱预测企业发展动向。
[0015]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现上述所述的基于未来产业企业的三网产业图谱构建方法。
[0016]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于未来产业企业的三网产业图谱构建方法。
[0017]本专利技术实施例为解决
技术介绍
所述问题,先构建企业三网产业数据源层,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于未来产业企业的三网产业图谱构建方法,其特征在于,所述方法包括:构建企业三网产业数据源层,根据所述企业三网产业数据源层获取企业信息,所述企业三网产业数据源层包括企业数据源网、行业数据源网与产业数据源网,所述企业数据源网、行业数据源网与产业数据源网均分别包括研究报告、互联网新闻、上市公司披露文本中的大量行业实体、关系和元素数据;根据所述企业信息建立三网产业数据库,将所述三网产业数据库与国民经济行业、企业产出融合;根据所述三网产业数据库构建三网产业图谱,所述构建三网产业图谱包括企业构建、多维构建与人工干预构建;根据所述三网产业图谱预测企业发展动向。2.如权利要求1所述的基于未来产业企业的三网产业图谱构建方法,其特征在于,所述企业构建包括:根据企业的产业链上中下游的细分行业确定企业的主营业务;若所述企业的主营业务属于细分行业,则将所述企业信息纳入所述企业构建中;若所述企业的主营业务不属于细分行业,则将所述企业信息进行筛除;获取所述企业的主营业务的产业链要素,所述产业链要素包括行业定义、竞争格局、历史与趋势、行业规模,获得所述企业构建结果。3.如权利要求1所述的基于未来产业企业的三网产业图谱构建方法,其特征在于,所述多维构建包括:构建多维训练模型,设定所述企业数据源网、行业数据源网与产业数据源网分别为矩阵X、Y、Z,表达式为:;其中,X、Y、Z方分别表示企业数据源网、行业数据源网与产业数据源网的信息的集合,表示为企业数据源网、行业数据源网之间的信息权值,表示为行业数据源网的维度值;通过所述多维训练模型对所述企业数据源网、行业数据源网与产业数据源网的信息进行训练,获取所述企业数据源网、行业数据源网与产业数据源网的信息特征,对所述信息特征进行分类。4.如权利要求3所述的基于未来产业企业的三网产业图谱构建方法,其特征在于,所述对所述信息特征进行分类,包括:将所述企业数据源网、行业数据源网与产业数据源网的信息提取成信息文本;标记所述信息文本的关键词,对所述信息文本的关键词进行标号,获得所述信息文本的关键词的ID;将所述信息文本的关键词的ID输入到所述多维训练模型中进行训练,获取所述企业数据源网、行业数据源网与产业数据源网的信息的分类结果,确定所述分类结果与所述企业的主营业务之间的联系。5.如权利要求4所述的基于未来产业企业的三网产业图谱构建方法,其特征在于,所述
确定所述分类结果与所述企业的主营业务之间的联系,包括:获取所述企业的主营业务的实体,将所述企业的主营业务的实体设定为矩阵,抽取所述分类结果中的信息与所述企业的主营业务的...

【专利技术属性】
技术研发人员:张士运刘平平张帅贾辉李梦茹闫博涵王健美邵颖史美鲜詹同叙
申请(专利权)人:北京市科学技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1