行业图谱的构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30823164 阅读:17 留言:0更新日期:2021-11-18 12:11
本公开提供了一种行业图谱的构建方法、装置、电子设备及存储介质,涉及计算机技术领域,具体涉及知识图谱和深度学习等人工智能技术领域。具体实现方案为:获取行业数据文件;将行业数据文件转换为半结构化行业数据文件;对半结构化行业数据文件进行解析,以获取至少一个计算节点的节点信息和行业SPO数据信息;以及根据节点信息和行业SPO数据信息生成行业图谱。由此,可以有效地降低多项目间计算流程定制成本,减少代码冗余,且灵活性高。且灵活性高。且灵活性高。

【技术实现步骤摘要】
行业图谱的构建方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,具体涉及知识图谱和深度学习等人工智能
,尤其涉及一种行业图谱的构建方法、装置、电子设备及存储介质。

技术介绍

[0002]随着近几年知识图谱技术的进步,越来越多关于知识图谱的研究与实践,从通用领域转向了垂直行业。
[0003]目前,通过知识图谱能力与行业场景的深度结合来提升行业的服务能力和服务效率已经成为一个重要趋势。

技术实现思路

[0004]本公开提供了一种行业图谱的构建方法、装置、电子设备及存储介质。
[0005]根据本公开的一方面,提供了一种行业图谱的构建方法,包括:
[0006]获取行业数据文件;
[0007]将所述行业数据文件转换为半结构化行业数据文件;
[0008]对所述半结构化行业数据文件进行解析,以获取至少一个计算节点的节点信息和行业SPO(Subject Predication Object,主语谓语宾语)数据信息;以及
[0009]根据所述节点信息和所述行业SPO数据信息生成行业图谱。
[0010]根据本公开的另一方面,提供了一种行业图谱的构建装置,包括:
[0011]获取模块,用于获取行业数据文件;
[0012]转换模块,用于将所述行业数据文件转换为半结构化行业数据文件;
[0013]解析模块,用于对所述半结构化行业数据文件进行解析,以获取至少一个计算节点的节点信息和行业SPO数据信息;以及
[0014]生成模块,用于根据所述节点信息和所述行业SPO数据信息生成行业图谱。
[0015]根据本公开的另一方面,提供了一种电子设备,包括:
[0016]至少一个处理器;以及
[0017]与所述至少一个处理器通信连接的存储器;其中,
[0018]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述一方面实施例所述的行业图谱的构建方法。
[0019]根据本公开另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述一方面实施例所述的行业图谱的构建方法。
[0020]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述一方面实施例所述的行业图谱的构建方法。
[0021]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特
征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0022]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0023]图1为本公开实施例提供的一种行业图谱的构建方法的流程示意图;
[0024]图2为本公开实施例提供的行业图谱构建平台的示意图;
[0025]图3为本公开实施例提供的另一种行业图谱的构建方法的流程示意图;
[0026]图4为本公开实施例提供的另一种行业图谱的构建方法的流程示意图;
[0027]图5为本公开实施例提供的另一种行业图谱的构建方法的流程示意图;
[0028]图6为本公开实施例提供的一种行业图谱的构建装置的结构示意图;以及
[0029]图7为根据本申请实施例的行业图谱的构建方法的电子设备的框图。
具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0031]下面参考附图描述本公开实施例的行业图谱的构建方法、装置、电子设备及存储介质。
[0032]知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。知识图谱,它能为学科研究提供切实的、有价值的参考。
[0033]深度学习是机器学习领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
[0034]人工智能是研究使用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的
也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术包括计算机视觉技术、语音识别技术、自然语言处理技术以及深度学习、大数据处理技术、知识图谱技术等几大方向。
[0035]本公开实施例提供的行业图谱的构建方法,可以由电子设备来执行,该电子设备可为PC(Personal Computer,个人计算机)电脑、平板电脑或掌上电脑等,此处不做任何限定。
[0036]在本公开实施例中,电子设备中可以设置有处理组件、存储组件和驱动组件。可选的,该驱动组件和处理组件可以集成设置,该存储组件可以存储操作系统、应用程序或其他程序模块,该处理组件通过执行存储组件中存储的应用程序来实现本公开实施例提供的行业图谱的构建方法。
[0037]图1为本公开实施例提供的一种行业图谱的构建方法的流程示意图。
[0038]本公开实施例的行业图谱的构建方法,还可由本公开实施例提供的行业图谱的构建装置执行,该装置可配置于电子设备中,以实现将获取到的行业数据文件转换为半结构化行业数据文件并对半结构化行业数据文件进行解析,以获取至少一个计算节点的节点信息和行业SPO数据信息,以及根据节点信息和行业SPO数据信息生成行业图谱,从而可以有效地降低多项目间计算流程定制成本,减少代码冗余,且灵活性高。
[0039]作为一种可能的情况,本公开实施例的行业图谱的构建方法还可以在服务器端执行,服务器可以为云服务器,可以在云端执行该行业图谱的构建方法。
[0040]在本公开实施例中,本公开实施例的行业图谱的构建方法可应用于行业图谱构建平台,例如,airflow(工作流平台),且该行业图谱构建平台可安装在电子设备中。
[0041]如图1所示,该行业图谱的构建方法,可包括:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行业图谱的构建方法,包括:获取行业数据文件;将所述行业数据文件转换为半结构化行业数据文件;对所述半结构化行业数据文件进行解析,以获取至少一个计算节点的节点信息和行业SPO数据信息;以及根据所述节点信息和所述行业SPO数据信息生成行业图谱。2.根据权利要求1所述的方法,其中,所述将所述行业数据文件转换为半结构化行业数据文件,包括:将所述行业数据文件转换为目标类型的数据文件;对所述目标类型的数据文件进行行业SPO抽取,以生成第一数据文件;基于属性映射策略对所述第一数据文件进行属性映射,以生成第二数据文件;基于清洗策略对所述第二数据文件进行清洗,以生成所述半结构化行业数据文件。3.根据权利要求2所述的方法,其中,所述对所述目标类型的数据文件进行行业SPO抽取,以生成第一数据文件,包括:获取抽取模型;将所述目标类型的数据文件输入至所述抽取模型;通过所述抽取模型对所述目标类型的数据文件进行行业SPO抽取,以生成所述第一数据文件。4.根据权利要求1所述的方法,其中,所述根据所述节点信息和所述行业SPO数据信息生成行业图谱,包括:分别对所述节点信息和所述行业SPO数据信息进行归一化处理,以生成行业归一化数据;根据所述行业归一化数据进行建边,以生成所述行业图谱。5.根据权利要求1

4中任一项所述的方法,其中,所述行业数据文件包括基于行业图谱构建平台生成的数据源文件和外部数据源文件。6.一种行业图谱的构建装置,包括:获取模块,用于获取行业数据文件;转换模块,用于将所述行业数据文件转换为半结构化行业数据文件;解析模块,用于对所述半结构化行业数据文件进行解析,以获取至少一个计算节点的节点信息和行业SPO数据信息;以及生成模块,用于根据所述节点信息和所述行业SPO数据信息生成行业图谱。7.根据权利...

【专利技术属性】
技术研发人员:曹亚男
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1