【技术实现步骤摘要】
一种基于概率软逻辑模型的实体解析方法
本专利技术属于实体解析
,具体涉及一种基于概率软逻辑模型的实体解析方法。
技术介绍
实体解析(EntityResolution,ER)也称为实体对齐(EntityAlignment)或实体匹配(Entitymatching),是判断在相同或者不相同数据集中,两个实体是否指向真实世界同一个对象。实体解析主要用于解决多源数据中实体冲突、指代不明等问题,帮助机器理解多数据源,构成了高质量的知识。近年来,随着知识爆炸式增长,实体解析技术在数据挖掘、信息融合等领域上应用取得成果,引起国内外学术研究者的高度关注。与此同时,实体解析技术已经广泛应用到医疗系统、银行管理系统、以及大规模知识库构建等领域。目前,对于实体解析的研究主要基于Fellegi-Sunter实体解析模型,主要通过匹配实体的属性集计算出两个实体相似度得分,再利用相似度得分判断这两个实体是否表示同一个实体,这种判断被称为匹配决策。对于实体属性集合来说,每个需要匹配的候选实体属性对,都需要进行匹配决策,并针对不同属性进行相应 ...
【技术保护点】
1.一种基于概率软逻辑模型的实体解析方法,其特征在于,包括以下步骤:/na、将实体解析中的实体属性、实体关系以及本体约束分别进行逻辑谓词表示;/nb、分别基于实体属性、实体关系以及本体约束构建实体解析过程中的一阶逻辑规则;/nc、结合步骤a中声明的逻辑谓词与步骤b中构建的逻辑规则设置一个关于实体解析的概率软逻辑模型;/nd、对概率软逻辑模型进行权重学习;/ne、使用推理算法对概率软逻辑模型进行计算,通过实体解析概率值。/n
【技术特征摘要】
1.一种基于概率软逻辑模型的实体解析方法,其特征在于,包括以下步骤:
a、将实体解析中的实体属性、实体关系以及本体约束分别进行逻辑谓词表示;
b、分别基于实体属性、实体关系以及本体约束构建实体解析过程中的一阶逻辑规则;
c、结合步骤a中声明的逻辑谓词与步骤b中构建的逻辑规则设置一个关于实体解析的概率软逻辑模型;
d、对概率软逻辑模型进行权重学习;
e、使用推理算法对概率软逻辑模型进行计算,通过实体解析概率值。
2.根据权利要求1中所述的基于概率软逻辑模型的实体解析方法,其特征在于,对实体属性进行逻辑谓词表示包括以下步骤:
a11、选取实体名字作为实体的重要属性,其余属性作为一般属性;
a12、重要属性采用属性名作为逻辑谓词,即Name(E,N)表示实体E的名字是N;一般属性采用统一谓词Property()表示,即Property(E,P,V)表示实体E存在属性P且该属性值为V。
3.根据权利要求1中所述的基于概率软逻辑模型的实体解析方法,其特征在于,对实体关系进行逻辑谓词具体为采用Relation()对实体关系进行谓词表示,即Relation(E1,E2,R),表示实体E1与实体E2之间关系是R。
4.根据权利要求1中所述的基于概率软逻辑模型的实体解析方法,其特征在于,对本体约束进行逻辑谓词具体为选取MUT()、DOM()、SUB()作为本体约束,并对本体约束进行谓词表示为Mut(T1,T2)表示实体所属类别不能同时是T1和T2,Sub(T1,T)表示实体的类别T1是T子类,Dom(E,D)表示实体E所属于领域为D。
5.根据权利要求1中所述的基于概率软逻辑模型的实体解析方法,其特征在于,基于实体属性构建的逻辑规则为:
其中,逻辑规则(b1)表示当实体A和B具有相同名字时,A和B可能表示同一个实体,Wn表示该逻辑规则权重;
逻辑规则(b2)表示当实体A和实体B同属一个类别且具有相似名字时,A和B可能表示同一个实体,Wt表示该逻辑规则权重,Similar(X,Y)表示计算X与Y相似度的相似函数;
逻辑规则(b3)表示当实体A和实体B具有相同...
【专利技术属性】
技术研发人员:韩伟红,宫云宝,陈雷霆,曹厚华,蒋振韬,
申请(专利权)人:电子科技大学广东电子信息工程研究院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。