知识图谱的生成方法及其装置制造方法及图纸

技术编号:20916556 阅读:17 留言:0更新日期:2019-04-20 09:41
本发明专利技术公开了一种知识图谱的生成方法及其装置。其中,方法包括:获取待生成知识图谱的主题,根据主题从多个数据源获取多个原始数据。对多个原始数据进行融合,以获取融合数据。根据融合数据,生成知识图谱。由此,本发明专利技术实施例实现了充分利用不同数据源的原始数据,避免了单个数据源出现异常时对知识图谱产生影响,提高了知识图谱的可靠性,同时也丰富了知识图谱的内容。解决了现有技术中数据源单一,一旦数据源发生异常,就导致生成的知识图谱也出现异常的技术问题。

Generation Method and Device of Knowledge Map

The invention discloses a method for generating knowledge map and a device thereof. Among them, the method includes: acquiring the subject of knowledge map to be generated, and acquiring multiple original data from multiple data sources according to the subject. Multi-raw data are fused to obtain the fused data. According to the fusion data, knowledge map is generated. Thus, the embodiment of the present invention makes full use of the original data of different data sources, avoids the influence of abnormal data sources on the knowledge map, improves the reliability of the knowledge map, and enriches the content of the knowledge map. It solves the technical problem of single data source in the existing technology. Once the data source is abnormal, the knowledge map generated will also appear abnormal.

【技术实现步骤摘要】
知识图谱的生成方法及其装置
本专利技术涉及数据处理
,尤其涉及一种知识图谱的生成方法及其装置。
技术介绍
知识图谱用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。伴随着信息化技术的发展,将不同知识资源采用知识图谱的方式提供给用户成为一种新的知识提供方案。实现该方案首先要从数据源中获取数据信息,生成知识图谱。相关技术中,可以从单个数据源获取数据信息生成知识图谱,例如从某个比较准确来源生成知识图谱。但是现有技术中,由于数据源单一,如果该数据源发生异常,会导致生成的知识图谱出现异常,因此存在隐患。并且,单个数据源的数据来源有限,也限制了知识图谱的丰富性。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种知识图谱的生成方法,以实现充分利用不同数据源的原始数据,避免单个数据源出现异常时对知识图谱产生影响,提高了知识图谱的可靠性,丰富了知识图谱的内容。本专利技术的第二个目的在于提出一种知识图谱的生成装置。本专利技术的第三个目的在于提出一种计算机程序产品。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本专利技术第一方面实施例提出了一种知识图谱的生成方法,包括:获取待生成知识图谱的主题;根据所述主题从多个数据源获取多个原始数据;对所述多个原始数据进行融合,以获取融合数据;根据所述融合数据,生成所述知识图谱。和现有技术相比,本专利技术实施例根据知识图谱的主题,从多个数据源获取多个原始数据,丰富了知识图谱的内容。对多个原始数据进行融合,以获取融合数据,并以此生成知识图谱。由此,充分利用了不同数据源的原始数据,避免了单个数据源出现异常时对知识图谱产生影响,提高了知识图谱的可靠性,同时也丰富了知识图谱的内容。另外,本专利技术实施例的知识图谱的生成方法,还具有如下附加的技术特征:可选地,所述根据所述主题从多个数据源获取多个原始数据,包括:根据所述主题,确定与所述主题相关的数据属性;从所述多个数据源获取包含所述数据属性的多个原始数据。可选地,所述对所述多个原始数据进行融合,以获取融合数据,包括:从所述多个原始数据中分别获取所述数据属性的多个原始数据值;对所述多个原始数据值进行融合,以获取所述融合数据中所述数据属性的融合数据值;根据所述数据属性和所述融合数据值,生成所述融合数据。可选地,所述对所述多个原始数据值进行融合,以获取所述融合数据中所述数据属性的融合数据值,包括:判断从所述多个原始数据中获取的多个所述原始数据值是否相等;若从所述多个原始数据中获取的多个所述原始数据值相等,则将所述原始数据值设置为所述融合数据值;若从所述多个原始数据中获取的多个所述原始数据值不相等,则根据所述原始数据的数据源,分别确定每个所述数据源的原始数据值所对应的准确率;根据所述每个所述数据源的原始数据值所对应的准确率设置所述融合数据值。可选地,所述根据所述原始数据的数据源,分别确定每个所述数据源的原始数据值所对应的准确率,包括:根据先验知识确定每个所述原始数据值的准确率;根据所述数据属性的特征判断所述数据属性是否属于动态属性,其中,所述动态属性是指所述数据属性会动态变化;若所述数据属性属于动态属性,则进一步判断所述数据属性的动态变化是否合法;若所述动态变化合法,则根据所述动态变化修改所述原始数据值的准确率。可选地,在所述判断所述数据属性是否属于动态属性之后,还包括:若所述数据属性不属于动态属性,则保持所述原始数据值的准确率不变。可选地,在所述判断所述数据属性的动态变化是否合法之后,还包括:若所述数据属性的动态变化不合法,则保持所述原始数据值的准确率不变。可选地,所述根据所述每个所述数据源的原始数据值所对应的准确率设置所述融合数据值,包括:从多个所述原始数据值中选择所述准确率最大的所述原始数据值作为所述融合数据值。本专利技术第二方面实施例提出了一种知识图谱的生成装置,包括:第一获取模块,用于获取待生成知识图谱的主题;第二获取模块,用于根据所述主题从多个数据源获取多个原始数据;融合模块,用于对所述多个原始数据进行融合,以获取融合数据;生成模块,用于根据所述融合数据,生成所述知识图谱。另外,本专利技术实施例的知识图谱的生成装置,还具有如下附加的技术特征:可选地,所述第二获取模块,包括:确定子模块,用于根据所述主题,确定与所述主题相关的数据属性;第一获取子模块,用于从所述多个数据源获取包含所述数据属性的多个原始数据。可选地,所述融合模块,包括:第二获取子模块,用于从所述多个原始数据中分别获取所述数据属性的多个原始数据值;融合子模块,用于对所述多个原始数据值进行融合,以获取所述融合数据中所述数据属性的融合数据值;生成子模块,用于根据所述数据属性和所述融合数据值,生成所述融合数据。可选地,所述融合子模块,包括:判断单元,用于判断从所述多个原始数据中获取的多个所述原始数据值是否相等;第一设置单元,用于当所述判断单元确定从所述多个原始数据中获取的多个所述原始数据值相等时,将所述原始数据值设置为所述融合数据值;确定单元,用于当所述判断单元确定从所述多个原始数据中获取的多个所述原始数据值不相等时,根据所述原始数据的数据源,分别确定每个所述数据源的原始数据值所对应的准确率;第二设置单元,用于根据所述每个所述数据源的原始数据值所对应的准确率设置所述融合数据值。可选地,所述确定单元,包括:确定子单元,用于根据先验知识确定每个所述原始数据值的准确率;第一判断子单元,用于根据所述数据属性的特征判断所述数据属性是否属于动态属性,其中,所述动态属性是指所述数据属性会动态变化;第二判断子单元,用于当所述第一判断子单元确定所述数据属性属于动态属性时,进一步判断所述数据属性的动态变化是否合法;修改子单元,用于当所述第二判断子单元确定所述动态变化合法时,根据所述动态变化修改所述原始数据值的准确率。可选地,所述确定单元,还包括:第一保持子单元,用于当所述第一判断子单元确定所述数据属性不属于动态属性时,保持所述原始数据值的准确率不变。可选地,所述确定单元,还包括:第二保持子单元,用于当所述第二判断子单元确定所述数据属性的动态变化不合法时,保持所述原始数据值的准确率不变。可选地,所述第二设置单元,具体用于从多个所述原始数据值中选择所述准确率最大的所述原始数据值作为所述融合数据值。本专利技术第三方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如前述方法实施例所述的知识图谱的生成方法。本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的知识图谱的生成方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1为本专利技术实施例所提供的一种知识图谱的生成方法的流程示意图;图2为本专利技术实施例所提供的知识图谱的生成方法的一个示例的示意图;图3为本专利技术实施例所提供的另一种知识图谱的生成方法的流程示意图;图4为本专利技术实施例所提供的又一种知识图谱的生成方法的流程示意图;图5为本专利技术实施例所提供的数据属性不属于动态属性时的一个示例的示意图;图6为本文档来自技高网...

【技术保护点】
1.一种知识图谱的生成方法,其特征在于,包括:获取待生成知识图谱的主题;根据所述主题从多个数据源获取多个原始数据;对所述多个原始数据进行融合,以获取融合数据;以及根据所述融合数据,生成所述知识图谱。

【技术特征摘要】
1.一种知识图谱的生成方法,其特征在于,包括:获取待生成知识图谱的主题;根据所述主题从多个数据源获取多个原始数据;对所述多个原始数据进行融合,以获取融合数据;以及根据所述融合数据,生成所述知识图谱。2.如权利要求1所述的方法,其特征在于,所述根据所述主题从多个数据源获取多个原始数据,包括:根据所述主题,确定与所述主题相关的数据属性;从所述多个数据源获取包含所述数据属性的多个原始数据。3.如权利要求2所述的方法,其特征在于,所述对所述多个原始数据进行融合,以获取融合数据,包括:从所述多个原始数据中分别获取所述数据属性的多个原始数据值;对所述多个原始数据值进行融合,以获取所述融合数据中所述数据属性的融合数据值;根据所述数据属性和所述融合数据值,生成所述融合数据。4.如权利要求3所述的方法,其特征在于,所述对所述多个原始数据值进行融合,以获取所述融合数据中所述数据属性的融合数据值,包括:判断从所述多个原始数据中获取的多个所述原始数据值是否相等;若从所述多个原始数据中获取的多个所述原始数据值相等,则将所述原始数据值设置为所述融合数据值;若从所述多个原始数据中获取的多个所述原始数据值不相等,则根据所述原始数据的数据源,分别确定每个所述数据源的原始数据值所对应的准确率;根据所述每个所述数据源的原始数据值所对应的准确率设置所述融合数据值。5.如权利要求4所述的方法,其特征在于,所述根据所述原始数据的数据源,分别确定每个所述数据源的原始数据值所对应的准确率,包括:根据先验知识确定每个所述原始数据值的准确率;根据所述数据属性的特征判断所述数据属性是否属于动态属性,其中,所述动态属性是指所述数据属性会动态变化;若所述数据属性属于动态属性,则进一步判断所述数据属性的动态变化是否合法;若所述动态变化合法,则根据所述动态变化修改所述原始数据值的准确率。6.如权利要求5所述的方法,其特征在于,在所述判断所述数据属性是否属于动态属性之后,还包括:若所述数据属性不属于动态属性,则保持所述原始数据值的准确率不变。7.如权利要求5所述的方法,其特征在于,在所述判断所述数据属性的动态变化是否合法之后,还包括:若所述数据属性的动态变化不合法,则保持所述原始数据值的准确率不变。8.如权利要求4-7中任一项所述的方法,其特征在于,所述根据所述每个所述数据源的原始数据值所对应的准确率设置所述融合数据值,包括:从多个所述原始数据值中选择所述准确率最大的所述原始数据值作为所述融合数据值。9.一种知识图谱的生成装置,其特征在于,所述装置包括:第一获取模块,用于获取待生成知识图谱的主题;第二获取模块,用于根据所述主题从多个数据源获取多个原始数据;融合模块,用于对所述多个原始数据进行融合,以获取融合数据;生成模块,用...

【专利技术属性】
技术研发人员:刘远圳罗雨
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1