【技术实现步骤摘要】
一种图谱网络的应用方法和装置
[0001]本专利技术涉及计算机应用领域,具体而言,涉及一种图谱网络的应用方法和装置。
技术介绍
[0002]如今互联网信息爆炸式增长,信息来源繁多,一个事件在一定时间内,来自不同来源的信息量会大量增长。在本领域中,使用图谱网络可以将各类信息的元素进行关联。
[0003]计算图谱网络中各元素之间的联系时,常用方法是通过统计的方法量化联系的程度,但如果不对关联的种类进行不同权重计算,会造成非重点信息关联程度提升,重点信息关联程度下降。另一方面,也不能针对内容的特点,微调重点信息的关联程度。
[0004]因此需要一种针对不同类型的关系,采用不同权重的查询方式,对图谱网络进行有效应用的技术方案。
技术实现思路
[0005]为解决以上问题,本申请提供了一种图谱网络的应用方法,包括以下步骤:
[0006]加载图谱网络,图谱网络的结构包括标题节点、元素节点和节点路径;其中,节点路径为标题节点与元素节点之间的关系元素;
[0007]根据图谱网络的内容确定话题主标题节点;
[0008]在图谱网络中进行图谱路径搜索,获取与话题主标题节点连通的相关元素节点和相关标题节点;
[0009]筛选相关元素节点和相关标题节点,获取有效话题集合;
[0010]根据相关标题节点对应的时间进行时间排序,生成有效话题有序集合。
[0011]其中,筛选相关元素节点和相关标题节点的方法还包括时间筛选:获取话题相关标题节点对应的时间边界,剔除时间范围外
【技术保护点】
【技术特征摘要】
1.一种图谱网络的应用方法,其特征在于,包括以下步骤:加载图谱网络,所述图谱网络的结构包括标题节点、元素节点和节点路径;其中,所述节点路径为标题节点与元素节点之间的关系元素;根据所述图谱网络的内容确定话题主标题节点;在所述图谱网络中进行图谱路径搜索,获取与所述话题主标题节点连通的相关元素节点和相关标题节点;筛选所述相关元素节点和相关标题节点,获取有效话题集合;根据所述相关标题节点对应的时间进行时间排序,生成有效话题有序集合。2.根据权利要求1所述的图谱网络的应用方法,其特征在于,所述筛选所述相关元素节点和相关标题节点的方法,包括时间筛选:获取所述话题相关标题节点对应的时间边界,剔除时间范围外的相关元素节点和相关标题节点;其中,所述时间边界包括所述话题集合对应的最小时限和最大时限。3.根据权利要求1所述的图谱网络的应用方法,其特征在于,所述筛选所述相关元素节点和相关标题节点的方法,还包括关联分值筛选,包括以下步骤:量化关系,计算所述相关标题节点与所述主标题节点的关联关系,生成所述话题相关标题节点的关联分值;清除关联分值不符合要求的相关元素节点和相关标题节点。4.根据权利要求3所述的图谱网络的应用方法,其特征在于,所述关系元素的内容包括:人物、国家、省份、城市、主宾语、谓语。5.根据权利要求4所述的图谱网络的应用方法,其特征在于,所述量化关系的计算公式为:score
i
=log(C
ner
‑
i
×
W
ner
+C
loc0
‑
i
×
W
loc0
+C
loc1
‑
i
×
W
loc1
+C
loc2
‑
i
×
W
loc2
+C
spo0
‑
i
×
W
spo0
+C
spo1
‑
i
×
W
spo1
)
‑
α,其中,α是偏移常量;C
ner
‑
i
=Length(ner
root Ι ner
i
),表示人物元素节点个数,W
ner
为对应权重系数;C
loc0
‑
i
=Length(loc0
root Ι loc0
i
),表示国家元素节点个数,W
loc0
为对应权重系数;C
loc1
‑
i
=Length(loc1
root Ι loc1
i
),表示省份元素节点个数,W
loc1
为对应权重系数;C
loc2
‑
i
=Length(loc2
root Ι loc2
i
),表示城市元素节点个数,W
loc2
为对应权重系数;C
spo0
‑
i
=Length(spo0
root Ι spo0
i
),表示主宾语元素节点个数,W
spo0
为对应权重系数;C
spo1
‑
i
=Length(spo1
root Ι spo1
i
),表示谓语元素节点个数,W
spo1
为对应权重系数。6.根据权利要求2所述的图谱网络的应用方法,其特征在于,所述时间筛选的计算方法指:`E
final
=TimeFilter(E
score
,min_time
S
‑
Δmin
t
,max_time
S
+Δmax
t
);其中,...
【专利技术属性】
技术研发人员:欧锦华,李晓鹏,田丹,高瑞雪,
申请(专利权)人:广州启生信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。