The invention relates to a method for generating relationship calculation models and a method for estimating relationship between entities. The method of calculating the model of the generation relationship according to the invention includes: generating a semantic map; selecting a node with a first type relationship and a node without the first type relationship as a first type of training sample from the semantic map; and two for training the first type training sample pairs according to the first type training sample. The first type relation weight parameter of the side of the path between the nodes, in which the relation calculation model includes the semantic graph and the first type relation weight parameter. Using the method of calculating the model based on the generation relation of the invention and the method of estimating the relationship between entities, the relationship calculation model can be established reliably, and the relationship between entity pairs is calculated accurately according to the model, and then the relationship between the entity pairs is estimated.
【技术实现步骤摘要】
生成关系计算模型的方法和估计实体对之间关系的方法
本专利技术的实施例涉及数据处理领域,具体地涉及生成关系计算模型的方法和估计实体对之间关系的方法。
技术介绍
这个部分提供了与本专利技术有关的背景信息,这不一定是现有技术。随着大数据的出现和发展,存在着海量的实体和实体之间的关系,然而很多实体之间的关系是稀疏的,即很多实体之间缺少关系或者关系不明确。此外,在现有技术中,缺少对关系的强度的定量评价。以文献数据中的实体关系为例。互联网中存在大量的文献数据,每一篇文献都包括作者、所属机构、文章、研究主题、杂志、会议和基金等信息,这些信息都可以称为实体。然而由于出版格式和要求不同,实体之间的关系可能存在缺失或者不明确。例如,一篇文献有两个作者A和B,有两个所属机构a和b,因而并不知道作者A从属于机构a还是机构b,也不知道作者B从属于机构a还是机构b。在这种情况下,作者与所属机构之间的关系缺失或者不明确。因此,希望提出一种方案能够建立关系计算模型从而可以计算任意一对实体之间的关系。此外,在现有技术中,即便知道实体对之间的关系,也缺少对关系强度的定量评价。例如,已知某个作者属于一个机构,则这个作者实体与这个机构实体存在从属关系。然而,在作者全职供职于该机构和兼职供职于该机构的情况下,这种从属关系的关系强度是不同的。在这种情况下,希望提出一种方案能够定量地分析实体对之间的关系强度。针对以上技术问题,本专利技术希望提出一种方案,能够快速可靠地建立关系计算的模型,从而能够根据该模型计算实体对之间关系的强弱,进而估计实体对之间的关系。
技术实现思路
这个部分提供了本专利技术的一般概要 ...
【技术保护点】
一种计算机实现的生成关系计算模型的方法,包括:生成语义图,所述语义图包括代表实体的多个节点和连接节点对的边,所述边代表所连接的节点对的关系;从所述语义图中选取具有第一类型关系的节点对和不具有所述第一类型关系的节点对作为第一类型训练样本对;以及根据所述第一类型训练样本对训练所述第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数,使得当根据所述第一类型关系权重参数来估计所述第一类型训练样本对所代表的实体对之间的关系时,差错率符合预定标准,其中,所述关系计算模型包括所述语义图和所述第一类型关系权重参数。
【技术特征摘要】
1.一种计算机实现的生成关系计算模型的方法,包括:生成语义图,所述语义图包括代表实体的多个节点和连接节点对的边,所述边代表所连接的节点对的关系;从所述语义图中选取具有第一类型关系的节点对和不具有所述第一类型关系的节点对作为第一类型训练样本对;以及根据所述第一类型训练样本对训练所述第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数,使得当根据所述第一类型关系权重参数来估计所述第一类型训练样本对所代表的实体对之间的关系时,差错率符合预定标准,其中,所述关系计算模型包括所述语义图和所述第一类型关系权重参数。2.根据权利要求1所述的生成关系计算模型的方法,还包括:从所述语义图中选取具有第二类型关系的节点对和不具有所述第二类型关系的节点对作为第二类型训练样本对;以及根据所述第二类型训练样本对训练所述第二类型训练样本对的两个节点之间的路径所包含的边的第二类型关系权重参数,使得当根据所述第二类型关系权重参数来估计所述第二类型训练样本对所代表的实体对之间的关系时,差错率符合预定标准,其中,所述关系计算模型还包括所述第二类型关系权重参数。3.根据权利要求1所述的生成关系计算模型的方法,其中,生成语义图还包括:当多个不同名称的实体实际为同一实体时,合并所述语义图中的代表所述多个实体的多个节点。4.根据权利要求1所述的生成关系计算模型的方法,其中,根据所述第一类型训练样本对训练所述第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数包括:针对所述第一类型训练样本对中的每一个训练样本对,确定所述训练样本对的两个节点之间的一条或者多条路径;以及根据所述第一类型训练样本对训练每一个训练样本对的每一条路径所包含的边的第一类型关系权重参数。5.根据权利要求4所述的生成关系计算模型的方法,其中,所述一条或者多条路径满足以下预...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。