基于元社会关系圈的人物知识图谱属性获取方法及装置制造方法及图纸

技术编号:21832950 阅读:18 留言:0更新日期:2019-08-10 18:06
本发明专利技术属于数据挖掘技术领域,特别涉及一种基于元社会关系圈的人物知识图谱属性获取方法及装置,该方法包含:遍历社交网络中用户,构建人物知识图谱,该人物知识图谱包含人物实体集合、人物实体之间的语义边集合、语义边对应的关系集合及语义边到关系集合的映射函数,每个人物实体设定有已知属性;基于用户的元社会关系圈推测用户未知属性并迭代更新人物知识图谱中属性值,直至社交网络中每个用户属性值均不再更新。本发明专利技术避免属性值摇摆等问题,且受元社会关系圈的条件限制,迭代过程收敛速度快,限定了特定社会关系与相应可推理属性类型的一致性,推测出的未知属性更准确,对基于人物关系的人物属性推理具有重要的指导意义。

Attribute Acquisition Method and Device of Character Knowledge Map Based on Meta-social Relation Circle

【技术实现步骤摘要】
基于元社会关系圈的人物知识图谱属性获取方法及装置
本专利技术属于数据挖掘
,特别涉及一种基于元社会关系圈的人物知识图谱属性获取方法及装置。
技术介绍
构建人物知识图谱,在民用市场、安全等领域,都具有十分广阔的应用前景。知识图谱通过融合来自各类数据源中的信息,并以规范化的本体描述,是一种良好的知识管理和组织工具。然而,由于人物属性信息的数据来源范围及信息抽取技术的限制导致初步构建的人物知识图谱存在一定程度的信息缺失,推理学习是知识图谱构建完善的重要方法,人物知识图谱推理即利用知识图谱的语义特性对初步构建的人物知识图谱缺失的关系与属性进行补全,从而构建完整的人物知识图谱。如何推理出缺失的人物属性信息,成为构建完整的知识图谱的一个关键问题。目前,基于知识图谱的实体属性推理方法较少,而针对社交网络用户的属性推测方法研究较多,主要分为基于分类器的推测方法、基于多数迭代投票的推测方法以及基于社团挖掘的推测方法,鉴于社交网络与知识图谱相似的图结构特点,可以借鉴这些方法解决知识图谱中的实体属性推理。基于分类器的方法是研究较早且使用广泛的一类方法,根据用户的已知属性,利用分类器对用户进行分类,并依据类中其他用户的属性信息对该用户的未知属性进行推测,此类方法建立在用户已知属性较多的基础上,具有一定的局限性。基于多数投票的方法,其现实基础是社交网络中拥有相同属性的用户之间倾向于建立社交关系,因此认为社交网络中用户的大多数邻居拥有某一属性,则该用户也拥有该属性。该方法每次迭代根据邻居节点内最多属性的标签来确定当前未知节点的属性,会出现在迭代过程中未知节点在两个或多个属性之间摇摆的现象,导致属性推测过程收敛慢、推测结果的准确率不高的问题。基于社团挖掘的属性推测方法认为在社交网络中,由于用户之间共享某种属性,会出现社团内部的节点部分属性趋于一致的现象,并将社交网络属性推测问题转化成了社团结构最优化问题,求解最优社团划分,并依据用户所处社团中的已知属性来推测用户的缺失属性。该方法仅依据节点的属性信息来划分社团,并没有考虑用户之间的关系,会出现社团内部节点关联不紧密的情况,导致推测结果不准确。而投票算法,虽考虑了用户之间的关系,但未考虑到与不同邻居节点之间的社交关系类型可能不同,而依据不同类型的社交关系推测某一特定属性,结果不准确。
技术实现思路
为此,本专利技术提供一种基于元社会关系圈的人物知识图谱属性获取方法及装置,解决当前人物知识图谱中属性推测迭代过程收敛慢、推测结果准确率不高等问题,用于推测人物知识图谱中人物的属性,以构建完整的人物知识图谱,具有较强的实用性和可操作性。按照本专利技术所提供的设计方案,一种基于元社会关系圈的人物知识图谱属性获取方法,包含如下内容:A)遍历社交网络中用户,构建人物知识图谱,该人物知识图谱包含人物实体集合、人物实体之间的语义边集合、语义边对应的关系集合及语义边到关系集合的映射函数,每个人物实体设定有已知属性;B)基于用户的元社会关系圈推测用户未知属性并迭代更新人物知识图谱中属性值,直至社交网络中每个用户属性值均不再更新。上述的,A)中,人物知识图谱表示为KG={V,E,R,F},其中,V表示人物实体集合,E表示人物实体之间的语义边集合,R表示语义边对应的关系集合,F表示语义边到R的映射函数。上述的,B)中,依据人物知识图谱中人物实体间映射函数,获取用户的元社会关系圈。优选的,依据人物知识图谱,对于人物实体,遍历其所有的邻居节点,确定人物实体相关的元社会关系圈集合。上述的,B)中,基于相同社会关系的人物实体间共享与社会关系对应的属性特点,运用多数迭代投票机制,推测人物知识图谱中人物实体未知属性。优选的,迭代过程中,记录每次人物实体属性值发生更新时新属性值的得票数,每一轮投票结束后,对于属性类型,将得票数最多的属性值作为候选属性值,在候选属性值得票数大于上一轮更新时属性值得票数时,更新人物实体的属性值。优选的,属性值投票中,遍历人物实体的元社交关系圈,并获取元社交关系圈中邻居节点的属性块数据,依据邻居节点属性块数据的属性类型及属性值是否相同,对对应属性类型的属性值进行投票。优选的,多数迭代投票机制更新属性值中,设定人物实体更新标志位,针对元社交关系圈中每个人物实体,遍历当前人物实体得票记录的属性类型,依据属性类型候选属性值得票数更新当前人物实体属性值,并记录人物实体更新标志位,直至遍历完当前人物实体的所有属性类型。更进一步地,本专利技术还提供一种基于元社会关系圈的人物知识图谱属性获取装置,包含:构建模块和更新模块,其中,构建模块,用于遍历社交网络中用户,构建人物知识图谱,该人物知识图谱包含人物实体集合、人物实体之间的语义边集合、语义边对应的关系集合及语义边到关系集合的映射函数,每个人物实体设定有已知属性;更新模块,用于基于用户的元社会关系圈推测用户未知属性并迭代更新人物知识图谱中属性值,直至社交网络中每个用户属性值均不再更新。本专利技术的有益效果:本专利技术基于彼此间有着相同社会关系的人物实体之间往往共享与社会关系对应的属性的特点,运用多数迭代投票思想推测人物知识图谱中人物实体的未知属性,在迭代过程中,只有当新标签的得票数高于上一轮标签得票数时才更新标签,因此不会出现属性值摇摆的问题,且受元社会关系圈的条件限制,迭代过程收敛速度快,定义的元社会关系圈,既可以确保参与投票的用户关系紧密,又限定了特定社会关系与相应可推理属性类型的一致性,因此推测出的未知属性更准确,以实现更加全面准确的反映人物实体的社会关系,对基于人物关系的人物属性推理具有重要的指导意义。附图说明:图1为实施例中人物知识图谱属性更新流程图;图2为实施例中属性推理原理示意;图3为实施例中人物知识图谱属性获取装置示意图;图4为实施例中人物知识图谱实例。具体实施方式:为使本专利技术的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本专利技术作进一步详细的说明。实施例中涉及到的技术术语如下:知识图谱(KnowledgeGraph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论,为学科研究提供切实的、有价值的参考。为解决当前人物知识图谱中属性推测迭代过程收敛慢、推测结果准确率不高等问题,本专利技术实施例,参见图1所示,提供一种基于元社会关系圈的人物知识图谱属性获取方法,包含:遍历社交网络中用户,构建人物知识图谱,该人物知识图谱包含人物实体集合、人物实体之间的语义边集合、语义边对应的关系集合及语义边到关系集合的映射函数,每个人物实体设定有已知属性;基于用户的元社会关系圈推测用户未知属性并迭代更新人物知识图谱中属性值,直至社交网络中每个用户属性值均不再更新。人物知识图谱推理利用知识图谱的语义特性对初步建立的人物知识图谱缺失关系与属性进行不全,从而构建完整的人物知识图谱,通过融合各类数据源信息,进本文档来自技高网
...

【技术保护点】
1.一种基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,包含如下内容:A)遍历社交网络中用户,构建人物知识图谱,该人物知识图谱包含人物实体集合、人物实体之间的语义边集合、语义边对应的关系集合及语义边到关系集合的映射函数,每个人物实体设定有已知属性;B)基于用户的元社会关系圈推测用户未知属性并迭代更新人物知识图谱中属性值,直至社交网络中每个用户属性值均不再更新。

【技术特征摘要】
1.一种基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,包含如下内容:A)遍历社交网络中用户,构建人物知识图谱,该人物知识图谱包含人物实体集合、人物实体之间的语义边集合、语义边对应的关系集合及语义边到关系集合的映射函数,每个人物实体设定有已知属性;B)基于用户的元社会关系圈推测用户未知属性并迭代更新人物知识图谱中属性值,直至社交网络中每个用户属性值均不再更新。2.根据权利要求1所述的基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,A)中,人物知识图谱表示为KG={V,E,R,F},其中,V表示人物实体集合,E表示人物实体之间的语义边集合,R表示语义边对应的关系集合,F表示语义边到R的映射函数。3.根据权利要求1所述的基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,B)中,依据人物知识图谱中人物实体间映射函数,获取用户的元社会关系圈。4.根据权利要求3所述的基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,依据人物知识图谱,对于人物实体,遍历其所有的邻居节点,确定人物实体相关的元社会关系圈集合。5.根据权利要求1所述的基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,B)中,基于相同社会关系的人物实体间共享与社会关系对应的属性特点,运用多数迭代投票机制,推测人物知识图谱中人物实体未知属性。6.根据权利要求5所述的基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,迭代过程中,记录每次人物实体属性值发生更新时新属性值的得票数,每一轮投票结束后,对于属性类型,将得票数最多的属性值作为候选属性值,在候选属性值得票数大于上一轮更新时属性值得票数时,更新人物实体的属性值。7.根据权利要求5所述的基于元社会关系圈的人物知识图谱属性获取方法,其特征在于,属性值投...

【专利技术属性】
技术研发人员:尹美娟刘晓楠邱庆云郑燕王奕博高文龙王灿
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1