【技术实现步骤摘要】
一种知识表示学习方法及系统
[0001]本专利技术属于表示学习领域,尤其涉及一种知识表示学习方法及系统。
技术介绍
[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]随着Web3.0时代的到来,包含大量结构化知识的知识库成为了许多语义应用(如智能问答和搜索服务)的重要组成部分,越来越多的企业和组织致力于构造大型知识库;知识库中的结构化知识以三元组(头实体、关系、尾实体)的形式表示;虽然现有的知识库已经包含了大量的三元组,但由于信息是海量且不断变化的,知识库中仍然有缺失的实体和关系;如何对知识库中实体间缺失的关系进行补全是知识库构造中的关键问题。
[0004]知识库补全任务需要对知识库中的实体和关系进行建模;符号表示是一类知识库建模方法,该类方法利用基于图的方法对知识库进行建模,然而随着知识库信息的增加,这种方法的效率较低且有数据稀疏问题。知识表示也是一类知识库建模方法,该类方法将实体和关系映射到低维稠密向量空间,通过向量运算的方式对知识库进行建模,很好地克服 ...
【技术保护点】
【技术特征摘要】
1.一种知识表示学习方法,其特征在于,用待建模的知识库对构建的知识表示模型进行训练,学习知识库中三元组的知识表示,完成知识库的建模;所述知识表示模型包括信息提取模块和编码器;所述信息提取模块,用于提取三元组的关系路径信息表示、文本描述信息表示以及实体层次类型信息表示;其中,采用TKRL中的加权层次编码器,构建投影矩阵,获取所述实体层次类型信息表示;所述编码器,以三元组的关系路径信息表示、文本描述信息表示、实体层次类型信息表示和结构化信息表示为输入,输出三元组的实体和关系的向量表示。2.如权利要求1所述的一种知识表示学习方法,其特征在于,所述关系路径信息表示,表示实体对之间的关系,具体公式为:表示实体对之间的关系,具体公式为:其中,p∈P(h,t)表示遍历实体对之间可能存在的关系路径,R(ph,t)表示给定实体对(h,t)之间有关系路径p的可靠性,Z是归一化因子。3.如权利要求1所述的一种知识表示学习方法,其特征在于,所述文本描述信息表示的提取步骤为:将文本描述信息通过词嵌入,分割嵌入和位置嵌入转化为多种形式的向量;将多种形式的向量拼接后,输入到BERT模型,提取文本描述信息特征,并生成句向量;将句向量进行平均,得到文本描述信息表示。4.如权利要求1所述的一种知识表示学习方法,其特征在于,构建的投影矩阵为:其中,n表示层次类型z的层数,z
(i)
是z的第i个子类型,表示z
(i)
的投影矩阵,α
i
表示的权重。5.如权利要求1所述的一种知识表示学习方法,其特征在于,所述获取所述实体层次类型信息表示,具体为:在获得投影矩阵之后,头实体和尾实体以TransR模型的方式分别投影到它们各自的特定空间中,...
【专利技术属性】
技术研发人员:耿玉水,陈晓雨,梁虎,赵晶,
申请(专利权)人:齐鲁工业大学山东省科学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。