The invention discloses a method for generating knowledge map and a device thereof. Among them, the method includes: acquiring the subject of knowledge map to be generated, and acquiring multiple original data from multiple data sources according to the subject. Multi-raw data are fused to obtain the fused data. According to the fusion data, knowledge map is generated. Thus, the embodiment of the present invention makes full use of the original data of different data sources, avoids the influence of abnormal data sources on the knowledge map, improves the reliability of the knowledge map, and enriches the content of the knowledge map. It solves the technical problem of single data source in the existing technology. Once the data source is abnormal, the knowledge map generated will also appear abnormal.
【技术实现步骤摘要】
知识图谱的生成方法及其装置
本专利技术涉及数据处理
,尤其涉及一种知识图谱的生成方法及其装置。
技术介绍
知识图谱用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。伴随着信息化技术的发展,将不同知识资源采用知识图谱的方式提供给用户成为一种新的知识提供方案。实现该方案首先要从数据源中获取数据信息,生成知识图谱。相关技术中,可以从单个数据源获取数据信息生成知识图谱,例如从某个比较准确来源生成知识图谱。但是现有技术中,由于数据源单一,如果该数据源发生异常,会导致生成的知识图谱出现异常,因此存在隐患。并且,单个数据源的数据来源有限,也限制了知识图谱的丰富性。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种知识图谱的生成方法,以实现充分利用不同数据源的原始数据,避免单个数据源出现异常时对知识图谱产生影响,提高了知识图谱的可靠性,丰富了知识图谱的内容。本专利技术的第二个目的在于提出一种知识图谱的生成装置。本专利技术的第三个目的在于提出一种计算机程序产品。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本专利技术第一方面实施例提出了一种知识图谱的生成方法,包括:获取待生成知识图谱的主题;根据所述主题从多个数据源获取多个原始数据;对所述多个原始数据进行融合,以获取融合数据;根据所述融合数据,生成所述知识图谱。和现有技术相比,本专利技术实施例根据知识图谱的主题,从多个数据源获取多个原始数据,丰富了知识图谱的内容。对多个原始数据进行融合,以获 ...
【技术保护点】
1.一种知识图谱的生成方法,其特征在于,包括:获取待生成知识图谱的主题;根据所述主题从多个数据源获取多个原始数据;对所述多个原始数据进行融合,以获取融合数据;以及根据所述融合数据,生成所述知识图谱。
【技术特征摘要】
1.一种知识图谱的生成方法,其特征在于,包括:获取待生成知识图谱的主题;根据所述主题从多个数据源获取多个原始数据;对所述多个原始数据进行融合,以获取融合数据;以及根据所述融合数据,生成所述知识图谱。2.如权利要求1所述的方法,其特征在于,所述根据所述主题从多个数据源获取多个原始数据,包括:根据所述主题,确定与所述主题相关的数据属性;从所述多个数据源获取包含所述数据属性的多个原始数据。3.如权利要求2所述的方法,其特征在于,所述对所述多个原始数据进行融合,以获取融合数据,包括:从所述多个原始数据中分别获取所述数据属性的多个原始数据值;对所述多个原始数据值进行融合,以获取所述融合数据中所述数据属性的融合数据值;根据所述数据属性和所述融合数据值,生成所述融合数据。4.如权利要求3所述的方法,其特征在于,所述对所述多个原始数据值进行融合,以获取所述融合数据中所述数据属性的融合数据值,包括:判断从所述多个原始数据中获取的多个所述原始数据值是否相等;若从所述多个原始数据中获取的多个所述原始数据值相等,则将所述原始数据值设置为所述融合数据值;若从所述多个原始数据中获取的多个所述原始数据值不相等,则根据所述原始数据的数据源,分别确定每个所述数据源的原始数据值所对应的准确率;根据所述每个所述数据源的原始数据值所对应的准确率设置所述融合数据值。5.如权利要求4所述的方法,其特征在于,所述根据所述原始数据的数据源,分别确定每个所述数据源的原始数据值所对应的准确率,包括:根据先验知识确定每个所述原始数据值的准确率;根据所述数据属性的特征判断所述数据属性是否属于动态属性,其中,所述动态属性是指所述数据属性会动态变化;若所述数据属性属于动态属性,则进一步判断所述数据属性的动态变化是否合法;若所述动态变化合法,则根据所述动态变化修改所述原始数据值的准确率。6.如权利要求5所述的方法,其特征在于,在所述判断所述数据属性是否属于动态属性之后,还包括:若所述数据属性不属于动态属性,则保持所述原始数据值的准确率不变。7.如权利要求5所述的方法,其特征在于,在所述判断所述数据属性的动态变化是否合法之后,还包括:若所述数据属性的动态变化不合法,则保持所述原始数据值的准确率不变。8.如权利要求4-7中任一项所述的方法,其特征在于,所述根据所述每个所述数据源的原始数据值所对应的准确率设置所述融合数据值,包括:从多个所述原始数据值中选择所述准确率最大的所述原始数据值作为所述融合数据值。9.一种知识图谱的生成装置,其特征在于,所述装置包括:第一获取模块,用于获取待生成知识图谱的主题;第二获取模块,用于根据所述主题从多个数据源获取多个原始数据;融合模块,用于对所述多个原始数据进行融合,以获取融合数据;生成模块,用...
【专利技术属性】
技术研发人员:刘远圳,罗雨,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。