基于剪枝技术与自动图扩展的知识图谱关联图布局方法技术

技术编号:29934389 阅读:10 留言:0更新日期:2021-09-04 19:08
一种基于实体热度剪枝与自动图扩展的知识图谱关联图布局方法,包括以下步骤:查询知识图谱中的实体关联图数据;采用实体热度评分方法计算实体热度,并根据实体热度对关联图进行裁剪;将剪裁后的关联图输入力导向布局算法,确定裁剪后的关联图中每个节点的初始横坐标和纵坐标;当需要对关联图中的某节点进行关联关系扩展时,获得待扩展节点的一跳关联节点集与关联关系,以待扩展节点为坐标原点,使用力导向布局算法计算一跳扩展节点集中节点的初始坐标;采用自动图扩展技术进行节点布局,将经过自动图扩展技术优化后的节点布局添加至待扩展关联图,完成最终的节点布局。完成最终的节点布局。完成最终的节点布局。

【技术实现步骤摘要】
基于剪枝技术与自动图扩展的知识图谱关联图布局方法


[0001]本专利技术涉及知识图谱推理领域,特别涉及一种基于实体热度剪枝与自动图扩展的知识图谱关联图布局方法。

技术介绍

[0002]知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一。本质上,知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,即关联图。在关联图中,节点表示实体或概念,边则表示实体之间的关联关系。
[0003]关联图布局,即查询与某节点相关联的节点和关联关系,并确定待展示节点的最优显示位置。关联图布局的应用也非常广泛,例如,关联图布局可用于搜索引擎,将关于某节点的属性或与其它节点的关系等信息展示出来,方便人们更便捷的获取信息。此外,关联图布局还可以用于知识推理,比如在金融行业通过对借贷人的相关信息进行显示,可以对异常借贷进行检测等。
[0004]目前,已有不少针对知识图谱关联图布局技术的研究。在现有的技术中,研究的重点是对已知节点和关联图进行布局,并着重提高关联图布局的效率和美观性。以现有的力导向自适应图布局方法为例,该方法通过为每个节点设置带有的电荷量,计算每个节点在其他节点的作用下受到的库伦斥力和胡克拉力。进一步计算每个节点受到的合力,从而计算每个节点应当移动的位移,以调整每个节点在分布图中的位置。该方法能够使得关联图布局相对均匀,相对对称,有助于让使用者得到最大的感知体验。但该方法在实际应用中,仍存在两个亟待解决的关键问题:其一,当关联图中节点和关联关系过多时,将导致关联图信息杂乱、冗余并无法显示有效信息。而在现有研究中,缺乏有效的对关联图剪枝的方法。其二,在现有的技术中,缺乏对关联图扩展技术的研究。当对关联图进行扩展时,采用单独计算扩展节点的坐标并增添至原关联图上的方法。这就导致关联图扩展后扩展节点分布较乱,极大的影响了关联图布局的合理性和美观性。

技术实现思路

[0005]有鉴于此,本专利技术的主要目的在于提供一种基于实体热度剪枝与自动图扩展的知识图谱关联图布局方法,以期部分地解决上述技术问题中的至少之一。
[0006]为了实现上述目的,本专利技术提供了一种基于实体热度剪枝与自动图扩展的知识图谱关联图布局方法,包括以下步骤:
[0007]查询知识图谱中的实体关联图数据,关联图中的节点代表知识图谱中的相关实体,关联图中的边代表实体之间的关联关系;
[0008]采用实体热度评分方法计算实体热度,并根据所述实体热度对所述关联图进行裁剪;
[0009]将剪裁后的关联图输入力导向布局算法,确定裁剪后的关联图中每个节点的初始
横坐标和纵坐标,根据所述实体热度评分确定所述每个节点在关联图上的显示半径,完成知识图谱关联图的初步布局;
[0010]当需要对所述关联图中的某节点进行关联关系扩展时,获得待扩展节点的一跳关联节点集与关联关系,以所述待扩展节点为坐标原点,使用所述力导向布局算法计算所述一跳扩展节点集中节点的初始坐标;
[0011]采用自动图扩展技术进行节点布局,具体包括:
[0012]根据所述关联图上的节点及坐标确定待扩展节点的扩展方位角;
[0013]将扩展节点集中节点的初始坐标转换为在待扩展关联图上的横、纵坐标;
[0014]当所述待扩展节点位于关联图中心位置附近时,使用中心节点扩展布局优化方法进行布局优化;以及
[0015]将经过自动图扩展技术优化后的节点布局添加至待扩展关联图,完成最终的节点布局。
[0016]其中,所述查询知识图谱中的实体关联图数据具体包括:
[0017]借助命名实体识别技术和实体关系抽取技术,向知识图谱系统的图数据库中添加节点和关联关系;
[0018]根据查询条件,在知识图谱的图数据库中查询实体的关联图数据,即与某节点相关联的节点以及各个节点之间的关联关系。
[0019]其中,所述采用实体热度评分方法计算实体热度,并根据所述实体热度对所述关联图进行裁剪具体包括:
[0020]根据实体在图谱系统各类文本中出现的频率以及用户对实体的访问痕迹频率,计算实体热度;
[0021]根据实体热度,对所述查询知识图谱中的实体关联图数据步骤中得到的关联图的节点进行剪裁;
[0022]对所述查询知识图谱中的实体关联图数据步骤中得到的关联图的关联关系进行剪裁。
[0023]其中,所述将剪裁后的关联图输入力导向布局算法,确定裁剪后的关联图中每个节点的初始横坐标和纵坐标,根据所述实体热度评分确定所述每个节点在关联图上的显示半径,完成知识图谱关联图的初步布局具体包括:
[0024]对节点随机定位;
[0025]分别算出每个节点的引力和排斥力;
[0026]根据节点热度确定节点半径r的计算方式为:
[0027][0028]其中,h表示实体热度,h
min
表示实体热度的最小值,h
max
表示实体热度的最大值,r
min
表示节点半径的最小值,r
max
表示节点半径的最大值。
[0029]其中,所述当需要对所述关联图中的某节点进行关联关系扩展时,获得待扩展节点的一跳关联节点集与关联关系,以所述待扩展节点为坐标原点,使用所述力导向布局算法计算所述一跳扩展节点集中节点的初始坐标具体包括:
[0030]根据查询条件,在知识图谱的图数据库中查询待扩展节点的一跳关联节点、关联
关系;
[0031]当查询到的待扩展节点的一跳关联节点的数量大于展示的节点数量时,即达到剪枝条件;根据关联图剪裁方法对查询到的关联节点、关联关系进行剪裁,得到剪裁后待扩展关联图,即待扩展节点的一跳扩展节点集、关联关系;
[0032]剪枝后以待扩展节点为坐标原点,使用所述力导向布局算法计算一跳扩展节点集中节点的初始坐标。
[0033]其中,所述根据所述关联图上的节点及坐标确定待扩展节点的扩展方位角具体包括:
[0034]将待扩展节点作为坐标原点,计算扩展前关联图上除待扩展节点外,其它任意节点在该第一坐标系下的横、纵坐标;
[0035]以待扩展节点作为极坐标系极点,计算扩展前关联图上除待扩展节点外,其它任意节点在该第二坐标系下的弧度;
[0036]将扩展前关联图上除待扩展节点外的其它所有节点在该第二坐标系下的弧度排序,并对排序后的相邻的两个弧度做差;
[0037]获取计算得到的最大弧度差,并根据该弧度差获得形成该弧度差的两个弧度α、β(α<β),则(α,β)即所求的扩展方位角。
[0038]其中,所述将扩展节点集中节点的初始坐标转换为在待扩展关联图上的横、纵坐标具体包括:
[0039]分别计算扩展节点集中任意节点在初始坐标下与待扩展节点的夹角γ
n
与距离l
n

[0040]将扩展节点集中任意节点的夹角γ<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于实体热度剪枝与自动图扩展的知识图谱关联图布局方法,其特征在于,包括以下步骤:查询知识图谱中的实体关联图数据,关联图中的节点代表知识图谱中的相关实体,关联图中的边代表实体之间的关联关系;采用实体热度评分方法计算实体热度,并根据所述实体热度对所述关联图进行裁剪;将剪裁后的关联图输入力导向布局算法,确定裁剪后的关联图中每个节点的初始横坐标和纵坐标,根据所述实体热度评分确定所述每个节点在关联图上的显示半径,完成知识图谱关联图的初步布局;当需要对所述关联图中的某节点进行关联关系扩展时,获得待扩展节点的一跳关联节点集与关联关系,以所述待扩展节点为坐标原点,使用所述力导向布局算法计算所述一跳扩展节点集中节点的初始坐标;采用自动图扩展技术进行节点布局,具体包括:根据所述关联图上的节点及坐标确定待扩展节点的扩展方位角;将扩展节点集中节点的初始坐标转换为在待扩展关联图上的横、纵坐标;当所述待扩展节点位于关联图中心位置附近时,使用中心节点扩展布局优化方法进行布局优化;以及将经过自动图扩展技术优化后的节点布局添加至待扩展关联图,完成最终的节点布局。2.根据权利要求1所述的知识图谱关联图布局方法,其特征在于,所述查询知识图谱中的实体关联图数据具体包括:借助命名实体识别技术和实体关系抽取技术,向知识图谱系统的图数据库中添加节点和关联关系;根据查询条件,在知识图谱的图数据库中查询实体的关联图数据,即与某节点相关联的节点以及各个节点之间的关联关系。3.根据权利要求1所述的知识图谱关联图布局方法,其特征在于,所述采用实体热度评分方法计算实体热度,并根据所述实体热度对所述关联图进行裁剪具体包括:根据实体在图谱系统各类文本中出现的频率以及用户对实体的访问痕迹频率,计算实体热度;根据实体热度,对所述查询知识图谱中的实体关联图数据步骤中得到的关联图的节点进行剪裁;对所述查询知识图谱中的实体关联图数据步骤中得到的关联图的关联关系进行剪裁。4.根据权利要求1所述的知识图谱关联图布局方法,其特征在于,所述将剪裁后的关联图输入力导向布局算法,确定裁剪后的关联图中每个节点的初始横坐标和纵坐标,根据所述实体热度评分确定所述每个节点在关联图上的显示半径,完成知识图谱关联图的初步布局具体包括:对节点随机定位;分别算出每个节点的引力和排斥力;根据节点热度确定节点半径r的计算方式为:
其中,h表示实体热度,h
min
表示实体热度的最小值,h
max
表示实体热度的最大值,r
min
表示节点半径的最小值,r
max
表示节点半径的最大值。5.根据权利要求1所述的知识图谱关联图布局方法,其特征在于,所述当需要对所述关联图中的某节点进行关联关系扩展时,获得待扩展节点的一跳关联节点集与关联关系,以所述待扩展节点为坐标原点,使用所述力导向布局算法计算所述一跳扩展节点集中节点的初始坐标具体包括:根据查询条件,在知识图谱的图数据库中查询待扩展节点的一跳关联节点、关联关系;当查询到的待扩展节点的一跳关联节点的数量大于展示的节点数量时,即达到剪枝条件;根据关联图剪裁方法对查询到的关联节点、关联关系进行剪裁,得到剪裁后待扩展关联图,即待扩展节点的一跳扩展节点集、关联关系;剪枝后以待扩展节点为坐标原点,使用所述力导向布局算法计算一跳扩展节点集中节点的初始坐标。6.根据权利要求1所述的知识图谱关联图布局方法,其特征在于,所述根据所述关联图上的节点及坐标确定待扩展节点的扩展方位角具体包括:将待扩展节点作为坐标原点,计算扩展前关联图上除待扩展节点外,其它任意节点在该第一坐标系下的横、纵坐标;以待扩展节点作为极坐标系极点,计算...

【专利技术属性】
技术研发人员:张源奔韩众和杨鑫李峰王洋郭岩谢辉平
申请(专利权)人:中国科学院空天信息创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1