The invention discloses a method and a device for constructing a knowledge map, belonging to the field of Internet technology. The method includes: Based on the target language, constructing the preliminary knowledge map for the target, the target language for lightweight data complexity is less than the RDF language exchange format, various key elements include semantic understanding required preliminary knowledge of various key elements stored in the same file; from at least one data source, matching at least one of the key elements of industry data collection and various key elements; add to industry data indicative of at least one of the key elements of the preliminary knowledge, knowledge map object. Since the knowledge map is constructed based on the lightweight target language which is less than RDF language, the knowledge map is readable and maintainable, and it can improve the chat effect of the chat robot. In addition, the knowledge map contains the key elements needed for semantic understanding and stored in the same file, so that it can be managed uniformly.
【技术实现步骤摘要】
知识图谱构建方法及装置
本专利技术涉及互联网
,特别涉及一种知识图谱构建方法及装置。
技术介绍
知识图谱,也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及知识之间的相互关系。时下,通过构建知识图谱,并将构建的知识图谱运用于聊天机器人实现智能问答,已经成为了本领域技术人员广泛采取的一种做法。相关技术在构建知识图谱时,通常采用RDF(ResourceDescriptionFramework,资源描述框架)语言构建针对目标物的知识图谱。其中,目标物既可指代某一个特定的领域,比如汽车领域,也可指代某一个特定的领域所属范围内一个子领域,比如汽车领域的发动机。由于RDF语言是基于XML(ExtensibleMarkupLanguage,可扩展标记语言)的,因此较为繁琐和复杂,所以构建的知识图谱可读性和可维护性差,进而导致聊天机器人的聊天效果不佳。
技术实现思路
为了解决相关技术的问题,本专利技术实施例提供了一种知识图谱构建方法及装置。所述技术方案如下:第一方面,提供了一种知识图谱构建方法,所述方法包括:基于目标语言,构建针对于目标物的初步知识图谱,所述目标语言为复杂度小于RDF语言的轻量级数据交换格式,所述初步知识图谱中包含语义理解所需的各种关键要素,所述各种关键要素存储在同一个文件中;从至少一个数据源,收集与所述各种关键要素中至少一种关键要素匹配的行业数据;将所述行业数据添加到所述初步知识图谱中所述至少一种关键要素指示的位置 ...
【技术保护点】
一种知识图谱构建方法,其特征在于,所述方法包括:基于目标语言,构建针对于目标物的初步知识图谱,所述目标语言为复杂度小于资源描述框架RDF语言的轻量级数据交换格式,所述初步知识图谱中包含语义理解所需的各种关键要素,所述各种关键要素存储在同一个文件中;从至少一个数据源,收集与所述各种关键要素中至少一种关键要素匹配的行业数据;将收集到的与所述至少一种关键要素匹配的行业数据添加到所述初步知识图谱中所述至少一种关键要素指示的位置,得到所述目标物的目标知识图谱。
【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,所述方法包括:基于目标语言,构建针对于目标物的初步知识图谱,所述目标语言为复杂度小于资源描述框架RDF语言的轻量级数据交换格式,所述初步知识图谱中包含语义理解所需的各种关键要素,所述各种关键要素存储在同一个文件中;从至少一个数据源,收集与所述各种关键要素中至少一种关键要素匹配的行业数据;将收集到的与所述至少一种关键要素匹配的行业数据添加到所述初步知识图谱中所述至少一种关键要素指示的位置,得到所述目标物的目标知识图谱。2.根据权利要求1所述的方法,其特征在于,所述各种关键要素包括概念集、概念-概念映射集、概念-实例映射集以及概念-同义词映射集,所述构建针对于目标物的初步知识图谱,包括:在所述初步知识图谱中构建用于进行概念描述的所述概念集;在所述初步知识图谱中构建用于描述概念与概念之间包含关系的所述概念-概念映射集;在所述初步知识图谱中构建用于描述概念与实例之间对应关系的所述概念-实例映射集;在所述初步知识图谱中构建用于描述概念与同义词之间对应关系的所述概念-同义词映射集。3.根据权利要求1所述的方法,其特征在于,所述基于目标语言,构建针对于目标物的初步知识图谱,包括:基于JavaScript对象表示法-链接数据JSON-LD语言,在同一个文件中构建针对所述目标物的初步知识图谱。4.根据权利要求1或2所述的方法,其特征在于,所述从至少一个数据源,收集与所述各种关键要素中至少一种关键要素匹配的行业数据,包括:从所述初步知识图谱的概念-实例映射集中导出数据收集模板,所述数据收集模板中包含所述概念-实例映射集中实例的值为空的至少一个指定概念;基于所述数据收集模板,从所述至少一个数据源,收集与所述至少一个指定概念匹配的行业数据;所述将收集到的与所述至少一种关键要素匹配的行业数据添加到所述初步知识图谱中所述至少一种关键要素指示的位置,包括:确定所述至少一个指定概念的实例在所述初步知识图谱中的位置;将收集到的与所述至少一个指定概念匹配的行业数据作为所述至少一个指定概念的实例的值,添加到所述至少一个指定概念的实例在所述初步知识图谱中的位置。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于自顶向下的抽取规则,从所述目标知识图谱中抽取所述各种关键要素,根据所述各种关键要素构建语义理解所需的自然语言理解语法库;或,基于自底向上的抽取规则,从所述目标知识图谱中抽取所述各种关键要素,根据所述各种关键要素构建所述自然语言理解语法库;或,基于自顶向下结合自底向上的抽取规则,从所述目标知识图谱中抽取所述各种关键要素,根据所述各种关键要素构建所述自然语言理解语法库;其中,所述自然语言理解语法库中包含所述目标知识图谱中描述的各种关键要素。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:在接收到用户终端的问答消息后,基于所述自然语言理解语法库,对所述问答消息进行语义理解,得到理解结果;根据所述理解结果,基于所述目标知识图谱生成所述问答消息的查询路径;基于所述查询路径,获取与所述问答消息匹配的应答消息,并将所...
【专利技术属性】
技术研发人员:李鹏,金星明,辛愿,李科,
申请(专利权)人:腾讯科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。