生成关系计算模型的方法和估计实体对之间关系的方法技术

技术编号:17796691 阅读:34 留言:0更新日期:2018-04-25 20:11
本发明专利技术涉及生成关系计算模型的方法和估计实体对之间关系的方法。根据本发明专利技术的生成关系计算模型的方法包括:生成语义图;从语义图中选取具有第一类型关系的节点对和不具有所述第一类型关系的节点对作为第一类型训练样本对;以及根据第一类型训练样本对训练第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数,其中,关系计算模型包括语义图和第一类型关系权重参数。使用根据本发明专利技术的生成关系计算模型的方法和估计实体对之间关系的方法能够可靠地建立关系计算模型,并根据该模型准确地计算实体对之间关系的强弱,进而估计实体对之间的关系。

Method for generating relation computation model and method for estimating relationship between entities

The invention relates to a method for generating relationship calculation models and a method for estimating relationship between entities. The method of calculating the model of the generation relationship according to the invention includes: generating a semantic map; selecting a node with a first type relationship and a node without the first type relationship as a first type of training sample from the semantic map; and two for training the first type training sample pairs according to the first type training sample. The first type relation weight parameter of the side of the path between the nodes, in which the relation calculation model includes the semantic graph and the first type relation weight parameter. Using the method of calculating the model based on the generation relation of the invention and the method of estimating the relationship between entities, the relationship calculation model can be established reliably, and the relationship between entity pairs is calculated accurately according to the model, and then the relationship between the entity pairs is estimated.

【技术实现步骤摘要】
生成关系计算模型的方法和估计实体对之间关系的方法
本专利技术的实施例涉及数据处理领域,具体地涉及生成关系计算模型的方法和估计实体对之间关系的方法。
技术介绍
这个部分提供了与本专利技术有关的背景信息,这不一定是现有技术。随着大数据的出现和发展,存在着海量的实体和实体之间的关系,然而很多实体之间的关系是稀疏的,即很多实体之间缺少关系或者关系不明确。此外,在现有技术中,缺少对关系的强度的定量评价。以文献数据中的实体关系为例。互联网中存在大量的文献数据,每一篇文献都包括作者、所属机构、文章、研究主题、杂志、会议和基金等信息,这些信息都可以称为实体。然而由于出版格式和要求不同,实体之间的关系可能存在缺失或者不明确。例如,一篇文献有两个作者A和B,有两个所属机构a和b,因而并不知道作者A从属于机构a还是机构b,也不知道作者B从属于机构a还是机构b。在这种情况下,作者与所属机构之间的关系缺失或者不明确。因此,希望提出一种方案能够建立关系计算模型从而可以计算任意一对实体之间的关系。此外,在现有技术中,即便知道实体对之间的关系,也缺少对关系强度的定量评价。例如,已知某个作者属于一个机构,则这个作者实体与这个机构实体存在从属关系。然而,在作者全职供职于该机构和兼职供职于该机构的情况下,这种从属关系的关系强度是不同的。在这种情况下,希望提出一种方案能够定量地分析实体对之间的关系强度。针对以上技术问题,本专利技术希望提出一种方案,能够快速可靠地建立关系计算的模型,从而能够根据该模型计算实体对之间关系的强弱,进而估计实体对之间的关系。
技术实现思路
这个部分提供了本专利技术的一般概要,而不是其全部范围或其全部特征的全面披露。本专利技术的目的在于提供一种用于生成关系计算模型的方法和估计实体对之间关系的方法,能够快速可靠地建立关系计算的模型,从而能够根据该模型计算实体对之间关系的强弱,进而估计实体对之间的关系。根据本专利技术的一方面,提供了一种计算机实现的生成关系计算模型的方法,包括:生成语义图,所述语义图包括代表实体的多个节点和连接节点对的边,所述边代表所连接的节点对的关系;从所述语义图中选取具有第一类型关系的节点对和不具有所述第一类型关系的节点对作为第一类型训练样本对;以及根据所述第一类型训练样本对训练所述第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数,使得当根据所述第一类型关系权重参数来估计所述第一类型训练样本对所代表的实体对之间的关系时,差错率符合预定标准,其中,所述关系计算模型包括所述语义图和所述第一类型关系权重参数。根据本专利技术的另一方面,提供了一种计算机实现的估计实体对之间关系的方法,包括:在关系计算模型中确定代表所述实体对的节点对之间的一条或者多条路径,其中所述关系计算模型包括语义图和第一类型关系权重参数,所述语义图包括代表实体的多个节点和连接节点对的边,所述边代表所连接的节点对的关系并且具有所述第一类型关系权重参数;针对所述一条或者多条路径中的每条路径,根据所述路径所包含的边的第一类型关系权重参数确定所述路径的第一类型关系强度;以及根据所有路径的第一类型关系强度确定所述实体对之间的第一类型关系强度。根据本专利技术的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本专利技术的生成关系计算模型的方法。根据本专利技术的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本专利技术的估计实体对之间关系的方法。根据本专利技术的另一方面,提供了一种机器可读存储介质,其上携带有根据本专利技术的程序产品。使用根据本专利技术的计算机实现的生成关系计算模型的方法,可以从语义图中选取具有某种类型关系的节点对和不具有某种类型关系的节点对作为这种类型关系的训练样本对,并可以训练样本对的两个节点之间的路径所包含的边的这种类型关系的权重参数。这样一来,通过选取正样本对(具有某种类型关系的节点对)和负样本对(不具有某种类型关系的节点对),对权重参数进行训练,使得训练出来的权重参数更加准确,从而能够快速可靠地建立关系计算的模型。使用根据本专利技术的计算机实现的估计实体对之间关系的方法,可以从关系计算模型中确定实体对之间的路径,根据路径的所有边的某种类型关系权重参数来确定这条路径的该类型关系强度,并可以根据所有路径的该类型关系强度来确定实体对之间的该类型关系强度。这样一来,可以根据关系模型对实体对之间关系的强弱进行量化,进而估计实体对之间的关系。这个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本专利技术的范围。附图说明在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不旨在限制本专利技术的范围。在附图中:图1为根据本专利技术一个实施例的生成关系计算模型的方法的流程图;图2为根据本专利技术一个实施例的语义图的示例;图3为图1中的步骤S230的流程图;图4为根据本专利技术一个实施例的估计实体对之间关系的方法的流程图;图5为图4中的步骤S420的流程图;图6为根据本专利技术的另一个实施例的估计实体对之间关系的方法的流程图;以及图7为其中可以实现根据本专利技术的生成关系计算模型的方法和估计实体对之间关系的方法的通用个人计算机的示例性结构的框图。虽然本专利技术容易经受各种修改和替换形式,但是其特定实施例已作为例子在附图中示出,并且在此详细描述。然而应当理解的是,在此对特定实施例的描述并不打算将本专利技术限制到公开的具体形式,而是相反地,本专利技术目的是要覆盖落在本专利技术的精神和范围之内的所有修改、等效和替换。要注意的是,贯穿几个附图,相应的标号指示相应的部件。具体实施方式现在参考附图来更加充分地描述本专利技术的示例。以下描述实质上只是示例性的,而不旨在限制本专利技术、应用或用途。下面提供了示例实施例,以便本专利技术将会变得详尽,并且将会向本领域技术人员充分地传达其范围。阐述了众多的特定细节如特定单元、装置和方法的示例,以提供对本专利技术的实施例的详尽理解。对于本领域技术人员而言将会明显的是,不需要使用特定的细节,示例实施例可以用许多不同的形式来实施,它们都不应当被解释为限制本专利技术的范围。在某些示例实施例中,没有详细地描述众所周知的过程、众所周知的结构和众所周知的技术。前文中提到,文献中的作者、所属机构、文章、研究主题、杂志、会议和基金等实体之间存在着各种关系,本专利技术所针对的实体和实体之间的关系并不限于此。例如,学生和教师可以作为实体对,实体之间的关系是指导教师;课程和教师可以作为实体对,实体之间的关系是授课;学校和地点可以作为实体对,实体之间的关系是位置;学校和电话号码可以作为实体对,实体之间的关系是从属等等。此外,本专利技术所针对的实体之间的关系并不限于一种类型的关系。例如,学生、教师和电话号码都可以作为实体,学生和教师之间存在着指导教师关系,教师和电话号码之间存在着从属关系。一对实体在诸如文献的数据对象中按照预定模式的出现代表该对实体间存在预定的关系。可以通过在数据对象中发现以任何预定模式出现的实体对来生成实体关系。下面结合图1来描述根据本专利技术的实施例的计算机实现的生成关系计算模型的方法。图1为根据本专利技术的实施例的生成关系计算模型的本文档来自技高网...
生成关系计算模型的方法和估计实体对之间关系的方法

【技术保护点】
一种计算机实现的生成关系计算模型的方法,包括:生成语义图,所述语义图包括代表实体的多个节点和连接节点对的边,所述边代表所连接的节点对的关系;从所述语义图中选取具有第一类型关系的节点对和不具有所述第一类型关系的节点对作为第一类型训练样本对;以及根据所述第一类型训练样本对训练所述第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数,使得当根据所述第一类型关系权重参数来估计所述第一类型训练样本对所代表的实体对之间的关系时,差错率符合预定标准,其中,所述关系计算模型包括所述语义图和所述第一类型关系权重参数。

【技术特征摘要】
1.一种计算机实现的生成关系计算模型的方法,包括:生成语义图,所述语义图包括代表实体的多个节点和连接节点对的边,所述边代表所连接的节点对的关系;从所述语义图中选取具有第一类型关系的节点对和不具有所述第一类型关系的节点对作为第一类型训练样本对;以及根据所述第一类型训练样本对训练所述第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数,使得当根据所述第一类型关系权重参数来估计所述第一类型训练样本对所代表的实体对之间的关系时,差错率符合预定标准,其中,所述关系计算模型包括所述语义图和所述第一类型关系权重参数。2.根据权利要求1所述的生成关系计算模型的方法,还包括:从所述语义图中选取具有第二类型关系的节点对和不具有所述第二类型关系的节点对作为第二类型训练样本对;以及根据所述第二类型训练样本对训练所述第二类型训练样本对的两个节点之间的路径所包含的边的第二类型关系权重参数,使得当根据所述第二类型关系权重参数来估计所述第二类型训练样本对所代表的实体对之间的关系时,差错率符合预定标准,其中,所述关系计算模型还包括所述第二类型关系权重参数。3.根据权利要求1所述的生成关系计算模型的方法,其中,生成语义图还包括:当多个不同名称的实体实际为同一实体时,合并所述语义图中的代表所述多个实体的多个节点。4.根据权利要求1所述的生成关系计算模型的方法,其中,根据所述第一类型训练样本对训练所述第一类型训练样本对的两个节点之间的路径所包含的边的第一类型关系权重参数包括:针对所述第一类型训练样本对中的每一个训练样本对,确定所述训练样本对的两个节点之间的一条或者多条路径;以及根据所述第一类型训练样本对训练每一个训练样本对的每一条路径所包含的边的第一类型关系权重参数。5.根据权利要求4所述的生成关系计算模型的方法,其中,所述一条或者多条路径满足以下预...

【专利技术属性】
技术研发人员:缪庆亮孟遥
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1