【技术实现步骤摘要】
知识图谱构建方法及装置、计算设备、存储介质
[0001]本申请要求于2019年08月26日提交的申请号为201910792526.0、专利技术名称为“一种知识图谱的构建方法和装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
[0002]本申请涉及云计算
,特别涉及一种知识图谱构建方法及装置、计算设备、存储介质。
技术介绍
[0003]越来越多的企业已经意识到知识对业务的重要性,迫切需要梳理业务中的知识体系,以提升工作效率和效果。知识图谱(knowledge graph,KG)作为知识组织与知识表示的一种表示形式,使用知识图谱表示知识体系已成为发展趋势。
[0004]相关技术中,在构建知识图谱时,需要先结合业务所属领域的领域知识设计知识图谱本体模型,然后对业务所涉及的数据进行信息抽取,以获取数据中用于指示实体的信息,然后将抽取到的信息填充到知识图谱本体中,得到知识图谱。
[0005]该知识图谱的构建过程通常采用定制化模块实现,该定制化模块是按照业务所属领域的领域需求定制的。但是,由于不同领域的需求不同,该定制化模块较难用于构建不同领域的知识图谱,导致其适用性较差。
技术实现思路
[0006]本申请提供了一种知识图谱构建方法及装置、计算设备、存储介质,可以解决相关技术中构建知识图谱的方法的适用性较差的问题。
[0007]第一方面,本申请提供了一种知识图谱构建方法,该方法包括:接收信息抽取指令,信息抽取指令用于指示对构建知识图谱的源数据进行信息抽取采用的 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,所述方法包括:接收信息抽取指令,所述信息抽取指令用于指示对构建知识图谱的源数据进行信息抽取采用的信息抽取策略;采用所述信息抽取指令所指示的信息抽取策略,对所述源数据进行信息抽取,得到多个多元组数据,每个多元组数据包括:用于指示实体的实体类型的信息、实体属性的信息和关联关系的信息;根据所述多个多元组数据,构建所述知识图谱,所述知识图谱记录所述源数据所包括的实体及不同实体之间的关系。2.根据权利要求1所述的方法,其特征在于,在所述根据所述多个多元组数据,构建所述知识图谱之前,所述方法还包括:获取用于构建所述知识图谱时需要使用的知识图谱本体模型,所述知识图谱本体模型定义所述知识图谱中多元组数据的标准化描述;接收映射策略指令,所述映射策略指令用于指示根据所述多元组数据的标准化描述对所述多个多元组数据进行关联映射的映射策略;根据所述多元组数据的标准化描述和所述映射策略指令所指示的映射策略,对所述多个多元组数据进行关联映射,得到采用所述多元组数据的标准化描述进行标准化描述的多个多元组数据;所述根据所述多个多元组数据,构建所述知识图谱,包括:根据标准化描述后的多个多元组数据,构建所述知识图谱。3.根据权利要求1或2所述的方法,其特征在于,在所述根据所述多个多元组数据,构建所述知识图谱之前,所述方法还包括:根据指定的多元组数据匹配策略,在所述多个多元组数据中,确定包括有指示同一实体的信息的不同多元组数据;对包括有指示同一实体的信息的不同多元组数据进行合并处理;所述根据所述多个多元组数据,构建所述知识图谱,包括:根据经过合并处理后的多个多元组数据,构建所述知识图谱。4.根据权利要求3所述的方法,其特征在于,在所述根据指定的多元组数据匹配策略,在所述多个多元组数据中,确定包括有指示同一实体的信息的不同多元组数据之前,所述方法还包括:接收匹配策略指令,所述匹配策略指令用于指示判断不同多元组数据中是否包括有指示同一实体的信息的匹配算法和匹配度阈值;所述根据指定的多元组数据匹配策略,在所述多个多元组数据中,确定包括有指示同一实体的信息的不同多元组数据,包括:当根据所述匹配策略指令所指示的匹配算法,确定两个多元组数据中指示实体的信息的匹配度不小于所述匹配度阈值时,确定所述两个多元组数据包括有指示同一实体的信息。5.根据权利要求1至4任一所述的方法,其特征在于,所述源数据包括:来源不同的多路数据,所述采用所述信息抽取指令所指示的信息抽取策略,对所述源数据进行信息抽取,得到多个多元组数据,包括:
分别采用所述信息抽取指令所指示的对每路数据进行信息抽取采用的信息抽取策略,对每路数据进行信息抽取,得到分别与所述多路数据对应的多个多元组数据;所述根据所述多个多元组数据,构建所述知识图谱,包括:根据与所述多路数据对应的多个多元组数据,构建所述知识图谱。6.根据权利要求1至5任一所述的方法,其特征在于,在所述根据所述多个多元组数据,构建所述知识图谱之后,所述方法还包括:在确定所述源数据发生更新后,根据所述信息抽取指令所指示的策略,对更新后的源数据中的增量数据进行信息抽取,得到所述增量数据对应的多个多元组数据;根据所述增量数据对应的多个多元组数据更新所述知识图谱。7.根据权利要求1所述的方法,其特征在于,所述采用所述信息抽取指令所指示的信息抽取策略,对所述源数据进行信息抽取,包括:采用所述信息抽取指令所指示的AI模型,对所述源数据进行信息抽取;其中,所述AI模型为已经过训练的模型,且所述AI模型的训练样本使用知识图谱本体模型中多元组数据的标准化描述进行标注,所述知识图谱本体模型定义...
【专利技术属性】
技术研发人员:郑毅,袁晶,卢栋才,王喆锋,怀宝兴,彭朱炜,王禹,章涛,王鹏,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。