【技术实现步骤摘要】
一种面向人物关系网络的自动元路径挖掘方法
[0001]本专利技术属于人工智能
,尤其涉及一种面向任务关系网络的网络 的自动元路径挖掘方法。
技术介绍
[0002]异质信息网络(HIN)(如DBPedia、亚马逊产品图和蛋白质数据库)在 近年来发展迅速,为许多现实应用(例如人物关系、学术活动、商业活动和 药物
‑
目标作用关系)提供了宝贵资源。如图1所示的异质信息网络是一种人 物关系网络,区分了网络中的实体类型和关系类型。为了更好地描述人物关 系的复杂结构,我们同时从两个视角来表征人物关系,即:(1)提供网络元 级描述的模式图(2)提供特定实体的实例级描述的实例图。为了捕获人物关 系中丰富的结构信息,元路径的概念被学者提出,以提供人物关系的元级描 述。给定两个特定实体,元路径是连接它们的实体类型和关系类型的序列, 是人物关系中路径的元级描述。例如在图1中,实体对普朗克和德国可以通 过以下元路径连接:过以下元路径连接:
[0003]这些元路径尽管中间实体类型和长度各不相同,但都在一定程度上说明 了普 ...
【技术保护点】
【技术特征摘要】
1.一种面向人物关系网络的自动元路径挖掘方法,其特征在于,包括以下步骤:获取人物关系网络的模式图和实例图;基于广度优先搜索,去除模式图和实例图中查询关系r
q
连接的所有实体对中去除r
q
后存在若干跳内的实例路径,剩下的实体对划分为训练集和测试集;检查训练集中与r
q
相关的所有实体对,使用智能体通过马尔科夫决策过程来挖掘元路径,智能体的奖励由实例图中元路径的覆盖率得到;使用策略网络进行迭代训练,训练过程中使用类型节点嵌入表示来表示模式图中的类型节点,加快元路径的搜索;训练结束后得到识别的元路径与其覆盖率和置信度;针对过滤后的测试集每个样本,将连接该样本所有元路径的置信度相加,该置信度总和为相似性;获取测试集中的事实三元组,其中待预测的实体在训练集中出现过,采用线性回归模型来预测给定两个实体之间是否存在某种关系;输出预测的两个实体间关系。2.根据权利要求1所述的面向人物关系网络的自动元路径挖掘方法,其特征在于,所述模式图包括实体类型T、关系R、类型映射τ和关系映射φ;针对查询关系r
q
,智能体随机从在模式图上由r
q
连接的实体类型对(t
src
,t
tgt
)中的头类型t
src
开始,并使用所述马尔科夫决策过程通过行走以最大化元路径对应的奖励。3.根据权利要求1所述的面向人物关系网络的自动元路径挖掘方法,其特征在于,所述马尔科夫决策过程用元组描述如下:在第i步,状态S
i
由(t
i
,t
src
,r
q
,t
tgt
)表示,其中t
i
代表当前实体类型,t
src
和t
tgt
为在模式图上由r
q
连接的实体类型对,状态空间包含了T
×
T
×
R
×
T中的所有有效组合;动作给定状态S
i
=(t
i
,t
src
,r
q
,t
tgt
),动作空间是模式图T
G
中类型节点t
i
的所有出边加上一个保持不动的操作,即从实体类型节点t
src
开始,所述智能体根据边r和尾实体类型节点t的嵌入表示,迭代地选l
‑
1次最偏好的动作,形成一条l长的元路径或者保持在t
tgt
,一旦智能体在最大步数前到达t
tgt
;环境机制由状态转移概率描述,描述,即智能体当前状态根据选择的r连接的类型节点t调整,为状态空间,为动作;奖励对当前发现的元路径的质量进行评估,并不断指导训练。4.根据权利要求3所述的面向人物关系网络的自动元路径挖掘方法,其特征在于,所述奖励计算如下:其中为实例图中元路径M的覆盖率,I
arrival
(M)∈{0,1}为到达指标,λ为加权组合系数,并归一化所述奖励在[0,1]区间;所述实例图中元路径M的覆盖率为由查询关系r
q
和M连接的实体对与在网络中由r
q
连接的所有实体对的比率,具体如下式计算:
其中,Con
M
(v
i
,v
j
)代表实体对(v
...
【专利技术属性】
技术研发人员:范长俊,刘世旋,刘忠,黄魁华,冯旸赫,成清,程光权,陈超,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。