【技术实现步骤摘要】
实体的链接方法、系统及存储介质
[0001]本专利技术涉及实体链接和知识图谱
,具体涉及一种实体的链接方法、系统及存储介质。
技术介绍
[0002]知识图谱是由节点和边构成的巨型语义网,其中节点表示物理世界中的概念和实体,边表示节点之间的拓扑链接和语义关系。近年来,知识图谱作为智能化应用的基础关键技术已经成为各界研究者关注的焦点。知识图谱能够为智能搜索、问答、推荐等系统提供知识支撑。然而,现实世界中知识是不断变化的,人们对世界的描述也在不断更新和修正。因此,为了更好地满足系统应用的需求,必须不断地对知识图谱进行知识扩充。基于序列决策的实体链接方法可以高效地进行知识图谱扩充。然而当前基于固定序列的实体链接模型忽略了提及的决策顺序,导致模型不能合理利用已链接的实体信息。
技术实现思路
[0003]本专利技术的目的在于克服上述技术不足,提供一种实体的链接方法、系统及存储介质,解决现有技术中如何利用提及的决策顺序实现实体链接的技术问题。
[0004]为达到上述技术目的,本专利技术的技术方案提供一种实体的 ...
【技术保护点】
【技术特征摘要】
1.一种实体的链接方法,其特征在于,包括以下步骤:S1、通过拼接文本和实体来构造输入数据,得到局部候选实体分数;S2、采用基于注意力的方式设计策略网络,计算每一个状态与动作空间中提及的相关分数;S3、将所述局部候选实体分数和所述每一个状态与动作空间中提及的相关分数拼接起来输入到前馈神经网络中得到候选实体的概率分布,根据所述概率分布链接相应的实体。2.根据权利要求1所述的实体的链接方法,其特征在于,在步骤S1中,所述输入数据的格式为:[CLS]w1,w2,...,w
t
[SEP]e1[SEP],...,e
n
[SEP]式,其中,w
t
是局部上下文单词,是候选实体,[CLS]用来编码文本序列的信息,[SEP]用来区分单词和实体。3.根据权利要求1所述的实体的链接方法,其特征在于,在步骤S1中,所述输入数据的表示是通过对以下四个部分求和得到,所述四部分为:1)将单词和实体的嵌入分别表示为W和E,E
i
=(w
ei
+B2e
i
)/2,w
ei
是实体的表面形式,B2是将实体从实体空间迁移到词空间;2)类型编码用于表明实体和单词的类型,单词类型为T0和实体类型为T1;3)分割编码用于区分不同的候选实体和上下文;4)位置编码表示单词在上下文中的位置。4.根据权利要求1所述的实体的链接方法,其特征在于,在步骤S1中,所述局部候选实体分数Φl(m)=F
out
,其中,F
out
=softmax(f2(Drop(ReLU(f1(o
cls
)))));fi是全连接层,Drop(
·
)是Dropou...
【专利技术属性】
技术研发人员:邓彪,翟飞飞,孙建,
申请(专利权)人:北京中科凡语科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。