图谱构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38464404 阅读:7 留言:0更新日期:2023-08-11 14:41
本发明专利技术实施例涉及一种图谱构建方法、装置、电子设备及存储介质,所述方法包括:从预设的产业数据库中确定与目标产业匹配的产业数据;根据所述产业数据确定产业链图谱中各实体之间的上下位关系;获取所述目标产业的企业信息;根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。由此,可以实现准确确定产业链图谱中各实体之间的上下位关系,避免需要人工大量的查阅产业资料,简化操作流程,提升了产业链图谱生成的便利性,一定程度上解决了人工构建可能不全面的问题。上解决了人工构建可能不全面的问题。上解决了人工构建可能不全面的问题。

【技术实现步骤摘要】
图谱构建方法、装置、电子设备及存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及一种图谱构建方法、装置、电子设备及存储介质。

技术介绍

[0002]产业链的本质是用于描述一个具有某种内在联系的企业群结构,它是一个相对宏观的概念,存在两维属性:结构属性和价值属性。产业链中大量存在着上下游关系和相互价值的交换,上游环节向下游环节输送产品或服务,下游环节向上游环节反馈信息。
[0003]目前,对某产业进行分析时,需要构建该产业的产业链图谱;一般的,在构建产业链图谱时,需要人工大量查阅产业资料,比较繁琐,另外,人工查阅产业资料构建产业链图谱还有可能出现构建不全面等问题。

技术实现思路

[0004]鉴于此,为解决上述在构建产业链图谱时,需要人工大量查阅产业资料,比较繁琐,另外,人工查阅产业资料构建产业链图谱还有可能出现构建不全面的技术问题,本专利技术实施例提供一种图谱构建方法、装置、电子设备及存储介质。
[0005]第一方面,本专利技术实施例提供一种图谱构建方法,所述方法包括:
[0006]从预设的产业数据库中确定与目标产业匹配的产业数据;
[0007]根据所述产业数据确定产业链图谱中各实体之间的上下位关系;
[0008]获取所述目标产业的企业信息;
[0009]根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。
[0010]在一可能的实施方式中,所述根据所述产业数据确定产业链图谱中各实体之间的上下位关系,包括:
[0011]获取预先训练的关系确定模型;
[0012]将所述产业数据输入至所述关系确定模型中,得到用于构建产业链图谱的各实体之间的上下位关系。
[0013]在一可能的实施方式中,所述将所述产业数据输入至所述关系确定模型中,得到用于构建产业链图谱的各实体之间的上下位关系,包括:
[0014]针对产业数据中每一句文本,对所述产业数据进行数据分类处理,得到分类后的文本;
[0015]在确定所述文本中包含上下位关系的情况下,对所述文本进行句法分析,得到包含上下位关系的词组集合;
[0016]确定与所述词组集合对应的词组向量;
[0017]对所述词组向量进行层次聚类处理,得到聚类后的词组簇;
[0018]根据预设的关系库,确定所述词组簇之间的上下位关系为实体之间的上下位关系。
[0019]在一可能的实施方式中,所述关系确定模型通过以下方式训练得到:
[0020]针对训练样本中每一句文本,对所述训练样本进行数据分类处理,得到分类后的文本样本;
[0021]在确定所述文本样本中包含上下位关系的情况下,对所述文本样本进行句法分析,得到包含上下位关系的词组样本集合;
[0022]确定与所述词组样本集合对应的词组向量样本为训练数据;
[0023]根据所述训练数据对预设的初始模型进行训练,得到关系确定模型。
[0024]在一可能的实施方式中,所述对所述产业数据进行数据分类处理,得到分类后的文本,包括:
[0025]将所述产业数据输入至预设的文本处理模型中,得到所述文本处理模型提取出的文本特征向量;
[0026]将所述文本特征向量输入至预设的分类模型,得到分类后的文本。
[0027]在一可能的实施方式中,所述对所述词组向量进行层次聚类处理,得到聚类后的词组簇,包括:
[0028]从多个所述词组向量中确定多个待处理的词组向量对;
[0029]针对每一待处理的词组向量对,利用预设的距离算法确定所述词组向量对中词组向量之间的距离值;
[0030]判断所述距离值是否达到预设的距离阈值;
[0031]若所述距离值未达到预设的距离阈值,则确定所述词组向量对中词组向量为同一词组簇;
[0032]若所述距离值达到预设的距离阈值,则确定所述词组向量对中词组向量为不同的词组簇。
[0033]在一可能的实施方式中,所述方法还包括:
[0034]从所述产业数据库中获取更新后的新产业数据;
[0035]基于所述新产业数据执行确定产业链图谱中各实体之间的上下位关系的步骤。
[0036]第二方面,本专利技术实施例提供一种图谱构建装置,所述装置包括:
[0037]数据确定模块,用于从预设的产业数据库中确定与目标产业匹配的产业数据;
[0038]关系确定模块,用于根据所述产业数据确定产业链图谱中各实体之间的上下位关系;
[0039]信息获取模块,用于获取所述目标产业的企业信息;
[0040]图谱构建模块,用于根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。
[0041]第三方面,本专利技术实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的图谱构建程序,以实现第一方面中任一项所述的图谱构建方法。
[0042]第四方面,本专利技术实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一项所述的图谱构建方法。
[0043]本专利技术实施例提供的技术方案,通过从预设的产业数据库中确定与目标产业匹配
的产业数据,根据产业数据确定产业链图谱中各实体之间的上下位关系。获取目标产业的企业信息,根据上下位关系及企业信息,构建目标产业的产业链图谱。由此,可以准确确定产业链图谱中各实体之间的上下位关系,避免需要人工大量的查阅产业资料,简化操作流程,提升了产业链图谱生成的便利性,一定程度上解决了人工构建可能不全面的问题。
附图说明
[0044]图1为本专利技术实施例提供的一种图谱构建方法的实施例流程图;
[0045]图2为本专利技术实施例提供的另一种图谱构建方法的实施例流程图;
[0046]图3为本专利技术实施例提供的一种数据分类方法的实施例流程图;
[0047]图4为本专利技术实施例提供的一种数据聚类方法的实施例流程图;
[0048]图5为本专利技术实施例示出的一种BERT模型的架构示意图;
[0049]图6为本专利技术实施例示出的一种GRU模型的架构示意图;
[0050]图7为本专利技术实施例提供的一种数据分类的结构示意图;
[0051]图8为本专利技术实施例提供的一种确定数据上下位关系方法的示意图;
[0052]图9为本专利技术实施例提供的一种图谱构建装置的实施例框图;
[0053]图10为本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0054]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0055]为便于理解本专利技术实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图谱构建方法,其特征在于,所述方法包括:从预设的产业数据库中确定与目标产业匹配的产业数据;根据所述产业数据确定产业链图谱中各实体之间的上下位关系;获取所述目标产业的企业信息;根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。2.根据权利要求1所述的方法,其特征在于,所述根据所述产业数据确定产业链图谱中各实体之间的上下位关系,包括:获取预先训练的关系确定模型;将所述产业数据输入至所述关系确定模型中,得到用于构建产业链图谱的各实体之间的上下位关系。3.根据权利要求2所述的方法,其特征在于,所述将所述产业数据输入至所述关系确定模型中,得到用于构建产业链图谱的各实体之间的上下位关系,包括:针对产业数据中每一句文本,对所述产业数据进行数据分类处理,得到分类后的文本;在确定所述文本中包含上下位关系的情况下,对所述文本进行句法分析,得到包含上下位关系的词组集合;确定与所述词组集合对应的词组向量;对所述词组向量进行层次聚类处理,得到聚类后的词组簇;根据预设的关系库,确定所述词组簇之间的上下位关系为实体之间的上下位关系。4.根据权利要求2所述的方法,其特征在于,所述关系确定模型通过以下方式训练得到:针对训练样本中每一句文本,对所述训练样本进行数据分类处理,得到分类后的文本样本;在确定所述文本样本中包含上下位关系的情况下,对所述文本样本进行句法分析,得到包含上下位关系的词组样本集合;确定与所述词组样本集合对应的词组向量样本为训练数据;根据所述训练数据对预设的初始模型进行训练,得到关系确定模型。5.根据权利要求3所述的方法,其特征在于,所述对所述产业数据进行数据分类处理,得到分类后的文本...

【专利技术属性】
技术研发人员:李美燕李林王秀文杨典陈鹏云杨菁林徐丹丹秦韬李娅强曾宣玮张栋王峰李政达秦恺
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1