一种基于JERPE的知识图谱构建方法技术

技术编号:37867459 阅读:13 留言:0更新日期:2023-06-15 20:57
本发明专利技术属于图谱构建方法技术领域,具体涉及一种基于JERPE的知识图谱构建方法,包括下列步骤:获取构建知识图谱所需要的数据源并将文本数据进行滑窗处理;初始化初级状态特征;初始化次级状态特征;初级状态特征与次级状态特征作为智能体所处的环境,最大化奖励更新多智能体的参数;中得到的多智能更新当前时刻的下一个时刻初级状态特征;得到当前时刻的下一个时刻次级状态特征;完成实体关系属性抽取而进行知识图谱构建。本发明专利技术能够解决传统管道式抽取中存在的积累误差问题,并且高效、准确地实现知识图谱的构建。能够为信息检索、智能对话等很多方面的应用,提供强有力的技术保障。提供强有力的技术保障。提供强有力的技术保障。

【技术实现步骤摘要】
一种基于JERPE的知识图谱构建方法


[0001]本专利技术属于图谱构建方法
,具体涉及一种基于JERPE的知识图谱构建方法。

技术介绍

[0002]当前,随着信息技术的高速发展,各个领域的信息化程度逐渐提高。知识图谱作为一种尤为重要的技术被应用在检索、智能对话等很多方向,得益于其在揭示真实世界事物间关系方面的天然优势,正是相互间的关系为每个节点的表征提供了更加全面的特征,使得语义推理能力非常出色。因而,知识图谱构建技术也作为一种关键技术而被广泛关注。
[0003]知识抽取作为自然语言处理中一项比较关键的基础性任务,旨在提取满足特定需求的数据。目前,抽取任务大部分还是基于管道式抽取,这种管道式抽取又会造成抽取中误差的积累。知识抽取作为知识图谱构建的基础环节,涉及实体、关系、属性的抽取。然而,现有技术方案中构建的知识图谱往往会存在一定程度的误差。用于解决传统知识图谱构建方法中误差积累的问题,是非常具有意义的。

技术实现思路

[0004]针对上述现有技术方案中构建的知识图谱往往会存在一定程度的误差的技术问题,本专利技术提供了一种基于JERPE的知识图谱构建方法,可以准确、自动地构建知识图谱。
[0005]为了解决上述技术问题,本专利技术采用的技术方案为:
[0006]一种基于JERPE的知识图谱构建方法,包括下列步骤:
[0007]S1、获取构建知识图谱所需要的数据源并将数据源中长度超多600的文本数据进行滑窗处理;
[0008]S2、初始化初级状态特征,此状态特征分别包含实体对、实体对间关系、实体对各个属性的位置特征信息;
[0009]S3、初始化次级状态特征,此状态特征分别包括实体对、实体与属性间隔距离特征;
[0010]S4、初级状态特征与次级状态特征作为智能体所处的环境,最大化奖励更新多智能体的参数;
[0011]S5、根据S4中得到的多智能更新当前时刻的下一个时刻初级状态特征;
[0012]S6、根据S5得到当前时刻的下一个时刻次级状态特征;
[0013]S7、迭代S4、S5、S6,完成实体关系属性抽取而进行知识图谱构建。
[0014]所述S1中获取需要进行提取信息的数据源并进行数据分割:
[0015]所述数据源包含在政务服务领域群众留言文本数据、政府单位官网关于单位简介的文本数据以及相关人物介绍的文本数据;
[0016]所述数据分割包含将数据源里文本长度超过512的文本进行滑窗处理,其中,滑动步长设置为50,可以将长文本分解为长度为512的文本进行信息提取,能够将长文本运算复
杂度降低。
[0017]所述S2中初始化初级状态特征包含第一状态分量S
t1
、第二状态分量S
t2

……
、第十状态分量S
t10

[0018]所述初始化初级状态特征为:
[0019][0020]其中,t=0,为512
×
10维二进制向量,S
t1
、S
t2
、...、S
t10
分别为512维二进制向量;第一分量S
t1
为实体对中第一个实体开始位置特征信息;第二分量S
t2
为实体对中第一个实体结束位置特征信息;第三分量S
t3
为实体对中第一个实体的属性开始位置特征信息;第四分量S
t4
为实体对中第一个实体的属性结束位置特征信息;第五分量S
t5
为实体对中第二个实体开始位置特征信息;第六分量S
t6
为实体对中第二个实体结束位置特征信息;第七分量S
t7
为实体对中第二个实体的属性开始位置特征信息;第八分量S
t8
为实体对中第二个实体的属性结束位置特征信息;第九分量S
t9
为实体对关系的开始位置信息;第十分量S
t1
为实体对关系的结束位置信息。
[0021]所述S3中初始化次级状态特征包含第一状态分量S
t1
、第二状态分量S
t12
、第三状态分量S
t13

[0022]所述初始化次级状态特征为:
[0023][0024][0025][0026][0027]其中,t=0,为512
×
3维二进制向量,S
t11
、S
t12
、S
t13
,分别为512维二进制向量;S
t11
为实体对中第一个实体与第二个实体间隔距离特征信息;S
t12
为实体对中第一个实体与第一个实体的属性间隔距离特征信息、S
t13
为实体对中第二个实体与第二个实体的属性间隔距离特征信息。
[0028]所述S4中根据S2、S3所得到的初始化初级状态特征初始化次级状态特征多智能体在时刻t进行策略选择A
t
并得到最大化奖励R来更新下一个时刻的环境状态:
[0029]所述策略选择A
t
为:
[0030]A
t
=[a
t1
,a
t2
,

,a
tN
][0031]其中,t=0,N=10,A
t
为512
×
10维二进制向量,a
tk
(k=1,2,

,N)表示第k个智能体的动作空间;a
t1
、a
t2


、a
tN
分别为512维二进制向量,表示第k个智能体在在t时刻的动作分量;a
t1
中1的位置索引为第1个智能体在t时刻对实体对中第一个实体开始位置的动作策略;a
t2
中1的位置索引为第2个智能体在t时刻对实体对中第一个实体结束位置的动作策略;a
t3
中1的位置索引为第3个智能体在t时刻对实体对中第一个实体属性开始位置的动作策略;a
t4
中1的位置索引为第4个智能体在t时刻对实体对中第一个实体属性结束位置的动作
策略;a
t5
中1的位置索引为第5个智能体在t时刻对实体对中第二个实体开始位置的动作策略;a
t6
中1的位置索引为第6个智能体在t时刻对实体对中第二个实体结束位置的动作策略;a
t7
中1的位置索引为第7个智能体在t时刻对实体对中第二个实体属性开始位置的动作策略;a
t8
中1的位置索引为第8个智能体在t时刻对实体对中第二个实体属性结束位置的动作策略;a
t9
中1的位置索引为第9个智能体在t时刻对实体对关系开始位置的动作策略;a
t10
中1的位置索引为第10个智能体在t时刻对实体对关系结束本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于JERPE的知识图谱构建方法,其特征在于:包括下列步骤:S1、获取构建知识图谱所需要的数据源并将数据源中长度超多600的文本数据进行滑窗处理;S2、初始化初级状态特征,此状态特征分别包含实体对、实体对间关系、实体对各个属性的位置特征信息;S3、初始化次级状态特征,此状态特征分别包括实体对、实体与属性间隔距离特征;S4、初级状态特征与次级状态特征作为智能体所处的环境,最大化奖励更新多智能体的参数;S5、根据S4中得到的多智能更新当前时刻的下一个时刻初级状态特征;S6、根据S5得到当前时刻的下一个时刻次级状态特征;S7、迭代S4、S5、S6,完成实体关系属性抽取而进行知识图谱构建。2.根据权利要求1所述的一种基于JERPE的知识图谱构建方法,其特征在于:所述S1中获取需要进行提取信息的数据源并进行数据分割:所述数据源包含在政务服务领域群众留言文本数据、政府单位官网关于单位简介的文本数据以及相关人物介绍的文本数据;所述数据分割包含将数据源里文本长度超过512的文本进行滑窗处理,其中,滑动步长设置为50,可以将长文本分解为长度为512的文本进行信息提取,能够将长文本运算复杂度降低。3.根据权利要求1所述的一种基于JERPE的知识图谱构建方法,其特征在于:所述S2中初始化初级状态特征包含第一状态分量S
t1
、第二状态分量S
t2

……
、第十状态分量S
t10
;所述初始化初级状态特征为:其中,t=0,为512
×
10维二进制向量,S
t1
、S
t2


、S
t10
分别为512维二进制向量;第一分量S
t1
为实体对中第一个实体开始位置特征信息;第二分量S
t2
为实体对中第一个实体结束位置特征信息;第三分量S
t3
为实体对中第一个实体的属性开始位置特征信息;第四分量S
t4
为实体对中第一个实体的属性结束位置特征信息;第五分量S
t5
为实体对中第二个实体开始位置特征信息;第六分量S
t6
为实体对中第二个实体结束位置特征信息;第七分量S
t7
为实体对中第二个实体的属性开始位置特征信息;第八分量S
t8
为实体对中第二个实体的属性结束位置特征信息;第九分量S
t9
为实体对关系的开始位置信息;第十分量S
t10
为实体对关系的结束位置信息。4.根据权利要求1所述的一种基于JERPE的知识图谱构建方法,其特征在于:所述S3中初始化次级状态特征包含第一状态分量S
t11
、第二状态分量S
t12
、第三状态分量S
t13
;所述初始化次级状态特征为:所述初始化次级状态特征为:所述初始化次级状态特征为:
其中,t=0,为512
×
3维二进制向量,S
t11
、S
t12
、S
t13
,分别为512维二进制向量;S
t11
为实体对中第一个实体与第二个实体间隔距离特征信息;S
t12
为实体对中第一个实体与第一个实体的属性间隔距离特征信息、S
t13
为实体对中第二个实体与第二个实体的属性间隔距离特征信息。5.根据权利要求1所述的一种基于JERPE的知识图谱构建方法,其特征在于:所述S4中根据S2、S3所得到的初始化初级状态特征初始化次级状态特征多智能体在时刻t进行策略选择A
t
并得到最大化奖励R来更新下一个时刻的环境状态:所述策略选择A
t
为:A
t
=[a
t1
,a
t2
,.....

【专利技术属性】
技术研发人员:王枭上官学奎刘东航陆文瑞马瑾男王志文王日中王荣王威展白瑞君潘炯吉
申请(专利权)人:山西省信息产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1