【技术实现步骤摘要】
信息处理方法、装置、计算机可读存储介质和计算机设备
本申请涉及知识图谱
,特别是涉及一种基于知识图谱的信息处理方法、装置、计算机可读存储介质和计算机设备。
技术介绍
知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在知识图谱的构建过程中,现有技术在进行实体融合时,往往需要在网页、文本等实体资源中把所有记录有对应实体的属性信息的三元组全部抽取出来,并按一定的规则来进行一一比较,以进行实体融合,整个处理过程较为繁琐,计算量较大。因此,现有技术在进行实体融合时存在效率不高的问题。
技术实现思路
基于此,有必要针对现有技术在进行实体融合时存在效率不高的技术问题,提供一种信息处理方法、装置、计算机可读存储介质和计算机设备。一种信息处理方法,所述方法包括:获取至少两个的待融合实体对应的实体描述信息;所述实体描述信息用于描述对应的所述待融合实体的实体信息;根据所述至少两个的待融合实体对应的实体描述信息,确定所述至少两个的待融合实体之间的公共领域;所述公共领域为各个所述待融合实体共同归属的领域;根据所述公共领域,确定各个所述待融合实体的关键比对属性;根据各个所述待融合实体的关键比对属性之间的属性相似度,对所述至少两个的待融合实体进行融合。一种信息处理装置,所述装置包括:获取模块,用于获取至 ...
【技术保护点】
1.一种信息处理方法,其特征在于,包括:/n获取至少两个的待融合实体对应的实体描述信息;所述实体描述信息用于描述对应的所述待融合实体的实体信息;/n根据所述至少两个的待融合实体对应的实体描述信息,确定所述至少两个的待融合实体之间的公共领域;所述公共领域为各个所述待融合实体共同归属的领域;/n根据所述公共领域,确定各个所述待融合实体的关键比对属性;/n根据各个所述待融合实体的关键比对属性之间的属性相似度,对所述至少两个的待融合实体进行融合。/n
【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:
获取至少两个的待融合实体对应的实体描述信息;所述实体描述信息用于描述对应的所述待融合实体的实体信息;
根据所述至少两个的待融合实体对应的实体描述信息,确定所述至少两个的待融合实体之间的公共领域;所述公共领域为各个所述待融合实体共同归属的领域;
根据所述公共领域,确定各个所述待融合实体的关键比对属性;
根据各个所述待融合实体的关键比对属性之间的属性相似度,对所述至少两个的待融合实体进行融合。
2.根据权利要求1所述的方法,其特征在于,当所述关键比对属性具有至少两个时,所述根据各个所述待融合实体的关键比对属性之间的属性相似度,对所述至少两个的待融合实体进行融合,包括:
分别获取每个所述关键比对属性对应的属性权重;
根据各个所述关键比对属性对应的属性权重,对各个所述关键比对属性的属性相似度进行加权平均,得到各个所述待融合实体之间的实体相似度;
根据所述实体相似度,对各个所述待融合实体进行融合。
3.根据权利要求1所述的方法,其特征在于,所述根据所述公共领域,确定各个所述待融合实体的关键比对属性,包括:
获取至少两个的实体比对规则;
当所述至少两个的实体比对规则中存在与所述公共领域匹配的目标实体比对规则时,在所述目标实体比对规则中,确定所述关键比对属性。
4.根据权利要求3所述的方法,其特征在于,当所述至少两个的实体比对规则中不存在与所述公共领域匹配的目标实体比对规则时,还包括:
在所述至少两个的待融合实体对应的实体描述信息中,抽取所述至少两个的待融合实体之间的公共属性;
基于所述至少两个的待融合实体对应的实体描述信息,确定各个所述待融合实体的公共属性之间的属性相似度;
根据各个所述待融合实体的公共属性之间的属性相似度,对所述至少两个的待融合实体进行融合。
5.根据权利要求4所述的方法,其特征在于,所述在所述至少两个的待融合实体对应的实体描述信息中,抽取所述至少两个的待融合实体之间的公共属性,包括:
在所述至少两个的待融合实体对应的实体描述信息中,分别抽取每个所述待融合实体对应的属性;
在各个所述待融合实体对应的属性中,确定各个所述待融合实体之间的相同属性;所述相同属性为各个所述待融合实体共同归属的属性;
将各个所述待融合实体之间的相同属性,作为所述至少两个的待融合实体之间的公共属性。
6.根据权利要求1所述的方法,其特征在于,所述根据所述公共领域,确定各个所述待融合实体的关键比对属性的步骤之后,还包括:
基于所述至少两个的待融合实体对应的实体描述信息,确定各个所述待融合实体的关键比对属性对应的属性值;
获取与所述关键比对属性的属性类型对应的相似度算法;并通过所述相似度算法,计算各个所述待融合实体的关键比对属性对应的属性值之间的相似度,作为各个所述待融合实体的关键比对属性之间的属性相似度。
7.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个的待融合实体对应的实体描述信息,确定所述至少两个的待融合实体之间的公共领域,包括:
根据所述至少两个的待融合实体对应的实体描述信息,确定各个所述待融合实体所归属的领域;
在各个所述待融合实体所归属的领域中,确...
【专利技术属性】
技术研发人员:荆宁,张红林,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。