一种图谱网络的应用方法和装置制造方法及图纸

技术编号:34436307 阅读:16 留言:0更新日期:2022-08-06 16:20
本发明专利技术公开了一种图谱网络的应用方法,包括以下步骤:加载图谱网络,结构包括标题节点、元素节点和节点路径;其中,节点路径为标题节点与元素节点之间的关系元素;根据图谱网络的内容确定话题主标题节点;在图谱网络中进行图谱路径搜索,获取与话题主标题节点连通的相关元素节点和相关标题节点;筛选相关元素节点和相关标题节点,获取有效话题集合;根据相关标题节点对应的时间进行时间排序,生成有效话题有序集合。根据上述技术方案,可以对关联的不同种类信息进行不同的权重计算,根据实际情况调整不同信息关联的权重,使量化的方式更精准,对图谱网络的使用更灵活。准,对图谱网络的使用更灵活。准,对图谱网络的使用更灵活。

【技术实现步骤摘要】
一种图谱网络的应用方法和装置


[0001]本专利技术涉及计算机应用领域,具体而言,涉及一种图谱网络的应用方法和装置。

技术介绍

[0002]如今互联网信息爆炸式增长,信息来源繁多,一个事件在一定时间内,来自不同来源的信息量会大量增长。在本领域中,使用图谱网络可以将各类信息的元素进行关联。
[0003]计算图谱网络中各元素之间的联系时,常用方法是通过统计的方法量化联系的程度,但如果不对关联的种类进行不同权重计算,会造成非重点信息关联程度提升,重点信息关联程度下降。另一方面,也不能针对内容的特点,微调重点信息的关联程度。
[0004]因此需要一种针对不同类型的关系,采用不同权重的查询方式,对图谱网络进行有效应用的技术方案。

技术实现思路

[0005]为解决以上问题,本申请提供了一种图谱网络的应用方法,包括以下步骤:
[0006]加载图谱网络,图谱网络的结构包括标题节点、元素节点和节点路径;其中,节点路径为标题节点与元素节点之间的关系元素;
[0007]根据图谱网络的内容确定话题主标题节点;
[0008]在图谱网络中进行图谱路径搜索,获取与话题主标题节点连通的相关元素节点和相关标题节点;
[0009]筛选相关元素节点和相关标题节点,获取有效话题集合;
[0010]根据相关标题节点对应的时间进行时间排序,生成有效话题有序集合。
[0011]其中,筛选相关元素节点和相关标题节点的方法还包括时间筛选:获取话题相关标题节点对应的时间边界,剔除时间范围外的相关元素节点和相关标题节点;其中,时间边界包括所述话题集合对应的最小时限和最大时限。
[0012]进一步的,筛选所述相关元素节点和相关标题节点的方法,还包括关联分值筛选,包括以下步骤:
[0013]量化关系,计算相关标题节点与所述主标题节点的关联关系,生成话题相关标题节点的关联分值;
[0014]清除关联分值不符合要求的相关元素节点和相关标题节点。
[0015]进一步的,关系元素的内容包括:人物、国家、省份、城市、主宾语、谓语。
[0016]进一步的,量化关系的计算公式为:
[0017]score
i
=log(C
ner

i
×
W
ner
+C
loc0

i
×
W
loc0
+C
loc1

i
×
W
loc1
+C
loc2

i
×
W
loc2
+C
spo0

i
×
W
spo0
+C
spo1

i
×
W
spo1
)

α,
[0018]其中,α是偏移常量;
[0019]C
ner

i
=Length(ner
root
Ι ner
i
),表示人物元素节点个数,W
ner
为对应权重系数;
[0020]C
loc0

i
=Length(loc0
root
Ι loc0
i
),表示国家元素节点个数,W
loc0
为对应权重系数;
[0021]C
loc1

i
=Length(loc1
root
Ι loc1
i
),表示省份元素节点个数,W
loc1
为对应权重系数;
[0022]C
loc2

i
=Length(loc2
root
Ι loc2
i
),表示城市元素节点个数,W
loc2
为对应权重系数;
[0023]C
spo0

i
=Length(spo0
root
Ι spo0
i
),表示主宾语元素节点个数,W
spo0
为对应权重系数;
[0024]C
spo1

i
=Length(spo1
root
Ι spo1
i
),表示谓语元素节点个数,W
spo1
为对应权重系数。
[0025]进一步的,时间筛选的计算方法指:
[0026]`E
final
=TimeFilter(E
score
,min_time
S

Δmin
t
,max_time
S
+Δmax
t
);
[0027]其中,E
score
为所述网络谱对应所有话题集合;,min_time
S
为所述话题时间边界之最小值;max_time
S
为话题时间边界之最大值,Δmin
t
为常量,表示以话题主标题节点的话题时间边界为基础,最小时间扩展的时间范围;
[0028]Δmax
t
为常量,表示以话题主标题节点的话题时间边界为基础,最大时间扩展的时间范围。
[0029]另一方面,本申请提供了一种图谱网络的应用装置,包括:
[0030]图谱网络加载模块:用于加载已生成的图谱网络,其结构包括标题节点、元素节点和节点路径;其中,所述节点路径为标题节点与元素节点之间的关系元素,其关系元素的内容包括:人物、国家、省份、城市、主宾语、谓语。
[0031]数据计算模块:用于在图谱网络中进行图谱路径搜索,计算结果为有效话题集合;
[0032]集合输出模块:用于对指定有效话题集合进行排序,生成有效话题有序集合并输出。
[0033]进一步的,数据计算模块包括:
[0034]主标题节点确定子模块:用于根据图谱网络的内容确定话题主标题节点;
[0035]计算搜索子模块:用于在图谱网络中进行图谱路径搜索,获取与话题主标题节点连通的相关元素节点和相关标题节点;
[0036]集合处理子模块:用于筛选相关元素节点和相关标题节点,获取有效话题集合。
[0037]进一步的,数据计算模块还包括计算规则确定子模块,用于量化相关元素节点和相关标题节点的关系,根据量化值确定筛选确定有效话题集合,其计算公式为:
[0038]score
i
=log(C
ner

i
×
W
ner
+C
loc0

i
×...

【技术保护点】

【技术特征摘要】
1.一种图谱网络的应用方法,其特征在于,包括以下步骤:加载图谱网络,所述图谱网络的结构包括标题节点、元素节点和节点路径;其中,所述节点路径为标题节点与元素节点之间的关系元素;根据所述图谱网络的内容确定话题主标题节点;在所述图谱网络中进行图谱路径搜索,获取与所述话题主标题节点连通的相关元素节点和相关标题节点;筛选所述相关元素节点和相关标题节点,获取有效话题集合;根据所述相关标题节点对应的时间进行时间排序,生成有效话题有序集合。2.根据权利要求1所述的图谱网络的应用方法,其特征在于,所述筛选所述相关元素节点和相关标题节点的方法,包括时间筛选:获取所述话题相关标题节点对应的时间边界,剔除时间范围外的相关元素节点和相关标题节点;其中,所述时间边界包括所述话题集合对应的最小时限和最大时限。3.根据权利要求1所述的图谱网络的应用方法,其特征在于,所述筛选所述相关元素节点和相关标题节点的方法,还包括关联分值筛选,包括以下步骤:量化关系,计算所述相关标题节点与所述主标题节点的关联关系,生成所述话题相关标题节点的关联分值;清除关联分值不符合要求的相关元素节点和相关标题节点。4.根据权利要求3所述的图谱网络的应用方法,其特征在于,所述关系元素的内容包括:人物、国家、省份、城市、主宾语、谓语。5.根据权利要求4所述的图谱网络的应用方法,其特征在于,所述量化关系的计算公式为:score
i
=log(C
ner

i
×
W
ner
+C
loc0

i
×
W
loc0
+C
loc1

i
×
W
loc1
+C
loc2

i
×
W
loc2
+C
spo0

i
×
W
spo0
+C
spo1

i
×
W
spo1
)

α,其中,α是偏移常量;C
ner

i
=Length(ner
root Ι ner
i
),表示人物元素节点个数,W
ner
为对应权重系数;C
loc0

i
=Length(loc0
root Ι loc0
i
),表示国家元素节点个数,W
loc0
为对应权重系数;C
loc1

i
=Length(loc1
root Ι loc1
i
),表示省份元素节点个数,W
loc1
为对应权重系数;C
loc2

i
=Length(loc2
root Ι loc2
i
),表示城市元素节点个数,W
loc2
为对应权重系数;C
spo0

i
=Length(spo0
root Ι spo0
i
),表示主宾语元素节点个数,W
spo0
为对应权重系数;C
spo1

i
=Length(spo1
root Ι spo1
i
),表示谓语元素节点个数,W
spo1
为对应权重系数。6.根据权利要求2所述的图谱网络的应用方法,其特征在于,所述时间筛选的计算方法指:`E
final
=TimeFilter(E
score
,min_time
S

Δmin
t
,max_time
S
+Δmax
t
);其中,...

【专利技术属性】
技术研发人员:欧锦华李晓鹏田丹高瑞雪
申请(专利权)人:广州启生信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1