基于实体超平面投影的知识表示学习模型制造技术

技术编号：22388130 阅读：43 留言：0更新日期：2019-10-29 06:44

基于实体超平面投影的知识表示学习模型，本发明专利技术涉及知识表示学习模型。本发明专利技术的目的是为了解决现有现有的知识表示学习模型大部分都只关注知识图谱的结构化信息，仅仅利用知识三元组来学习实体以及关系的表示，却忽略了实体的文本描述中可能蕴含的一些有用信息，导致处理任务时准确率低的问题。过程为：步骤一、将实体的描述文本处理成矩阵形式；步骤二、将步骤一得到的矩阵形式的文本输入到卷积神经网络中，得到实体描述文本的特征向量；步骤三、利用步骤二得到的特征向量建立EHP模型，得到实体以及关系的最终向量表示。本发明专利技术用于自然语言处理领域。

Knowledge representation learning model based on solid hyperplane projection

全部详细技术资料下载

【技术实现步骤摘要】
基于实体超平面投影的知识表示学习模型
本专利技术涉及知识表示学习模型。
技术介绍
早期的知识表示学习模型有结构表示模型SE(Bordesetal.2011)、矩阵分解模型RESACL(Nickeletal.2011)等。这些模型复杂度高、计算效率低，因此未能够广泛大规模使用。直到出现了了简单高效的翻译模型TransE(Bordesetal.2013)，将关系表示向量r看作头实体表示向量h到尾实体表示向量t的翻译，即满足h+r≈t。TransE模型在处理1-1关系时表现良好，但在处理1-N，N-1，N-N复杂关系时有很大的局限性。为此，TransH(Wangetal.2014b)模型首先将头实体向量和尾实体向量沿法线wr投影到关系r对应的超平面上，然后再进行翻译。TransR(Linetal.2015)模型则认为不同的关系拥有不同的语义空间，对每个三元组，首先应将实体投影到对应的关系空间中，然后再建立从头实体到尾实体的翻译关系。TransD(Jietal.2015)模型则是在TransR模型的基础上将头尾实体分别投影到不同的语义空间中。之后的TransA(Xiaoetal.2015)、本文档来自技高网...

【技术保护点】
1.基于实体超平面投影的知识表示学习模型，具体是按照以下步骤进行的：步骤一、将实体的描述文本处理成矩阵形式；步骤二、将步骤一得到的矩阵形式的文本输入到卷积神经网络中，得到实体描述文本的特征向量；步骤三、利用步骤二得到的特征向量建立EHP模型，得到实体以及关系的最终向量表示。

【技术特征摘要】
1.基于实体超平面投影的知识表示学习模型，具体是按照以下步骤进行的：步骤一、将实体的描述文本处理成矩阵形式；步骤二、将步骤一得到的矩阵形式的文本输入到卷积神经网络中，得到实体描述文本的特征向量；步骤三、利用步骤二得到的特征向量建立EHP模型，得到实体以及关系的最终向量表示。2.根据权利要求1所述基于实体超平面投影的知识表示学习模型，所述步骤一中将实体的描述文本处理成矩阵形式；具体过程为：步骤一一、对实体的描述文本进行预处理：1)根据停用词词表去除文本中的停用词；2)对去除停用词后的文本统一英文大小写字符；3)针对实体的描述文本中的实体名称将实体名称看作一个词而不进行拆分；经过预处理后的文本被处理成有语序的多个词语的集合，预处理后的文本表示为X＝{x1,…,xi,…,xn}，其中xi代表文本预处理后的第i个词；步骤一二、分别将步骤一一得到的预处理后的文本中的每一个词输入到word2vec模型，得到文本中的每一个词的词向量表示，基于词向量得到文本矩阵；其中矩阵每一行是一个词的表示向量。3.根据权利要求1或2所述基于实体超平面投影的知识表示学习模型，所述步骤二中将步骤一得到的矩阵形式的文本输入到卷积神经网络中，得到实体描述文本的特征向量；具体过程为：卷积神经网络设置为6层拓扑结构，卷积神经网络的网络结构包括1层输入层、第一层卷积层、第一层池化层、第二层卷积层、第二层池化层、1层输出层；1)卷积层设置：使用一组长度为k的一维卷积层，k是文本的长度也就是单词数，实体经过预处理后的文本序列X＝{x1,…,xn}即为第一层卷积层的输入，采用补零的方法在序列后面补上全零向量，非线性函数使用ReLU函数；2)池化层设置：第一层池化层采用m-最大池化策略，第二层池化层采用平均池化策略；3)通过最小化目标函数反向传播更新卷积神...

【专利技术属性】
技术研发人员：王念滨，秦帅，张耘，张毅，王红滨，周连科，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人