基于外部知识嵌入的文本理解方法技术

技术编号：27685503 阅读：26 留言：0更新日期：2021-03-17 03:52

本发明专利技术公开了一种基于外部知识嵌入的文本理解方法，采用下述步骤：先聚类算法将数据集中的实体划分，并通过随机采样拼接在数据集中添加负例三元组；再，在Keras深度学习框架下搭建BERT网络,对知识图谱中的实体关系进行编码，获得相应的表征向量；又，使用多粒度卷积，抽取不同维度的低级特征，更加提升模型特征抽取能力；通过胶囊神经网络来挖掘实体间深层次关系，从而补全知识图谱并提高知识准确性；又再，该实体关系的编码作为外部知识与文本实体信息进行融合；最后，使用自注意力机制将知识向量与文本上下文交互，通过多层感知机得出答案。故该方法能使机器很好地理解上、下文含义，使得网络的智能化水平更高，更接近于人类的认知思维。

全部详细技术资料下载

【技术实现步骤摘要】
基于外部知识嵌入的文本理解方法
本专利技术属于自然语言处理，知识表示与机器阅读理解
，特别涉及一种基于外部知识嵌入的文本理解方法。
技术介绍
知识图谱，由Google于2012年正式提出，其初衷是为了优化搜索返回结果，增强用户搜索质量和体验。知识图谱为互联网上海量，异构，动态的大数据表示，组织，管理以及利用提供了一种更为有效的方式，使得网络的智能化水平更高，更接近于人类的认知思维。其通常被表示为三元组G(Eh,R,Et)，其中E是知识图谱中的实体集合，Eh和Et分别表示头部实体和尾部实体,R表示实体之间的关系。用预训练语言模型来解决自然语言处理领域的问题是十分有效的，它可以将原本无语义信息的独热编码(One-hot)转变为包含语义的词嵌入(wordembedding)，为下游任务提供良好支撑。Word2Vec，ELMO，Glove等等都是目前主流使用的预训练语言模型，并在各个下游任务中都获得了很好的效果。目前将预训练语言表征应用于下游任务主要有两种策略，一种是基于特征使用，即直接取得模型的输出作为下游模型的输入；第二种是基于微调的架构使用，即引入特定任务的参数、输入输出，微调预训练的参数以使得模型更加适合下游任务。目前的研究证明，第二种方式能够在各个应用任务中获得更好的效果。BERT是2018年谷歌率先提出的语言模型，由多层Transformer组成，能够准确有效地提取文本的有效信息。其模型结构可以随下游任务进行变换以适应下游任务的要求。机器阅读理解就是让机器学会阅读和理解文章，即对于给定的问题...

【技术保护点】
1.一种基于外部知识嵌入的文本理解方法，其特征是：/n包含以下步骤：/n步骤1：通过聚类算法将数据集中的实体划分，并通过随机采样拼接在数据集中添加负例三元组；/n步骤2：在Keras深度学习框架下搭建BERT网络,对知识图谱中的实体关系进行编码，获得相应的表征向量/n步骤3：使用多粒度卷积，抽取不同维度的低级特征，更加提升模型特征抽取能力；/n步骤4：通过胶囊神经网络来挖掘实体间深层次关系，从而补全知识图谱并提高知识准确性；/n步骤5：将步骤2中实体关系的编码作为外部知识与文本实体信息进行融合；/n步骤6：使用自注意力机制将知识向量与文本上下文交互，通过多层感知机得出答案。/n

【技术特征摘要】
1.一种基于外部知识嵌入的文本理解方法，其特征是：
包含以下步骤：
步骤1：通过聚类算法将数据集中的实体划分，并通过随机采样拼接在数据集中添加负例三元组；
步骤2：在Keras深度学习框架下搭建BERT网络,对知识图谱中的实体关系进行编码，获得相应的表征向量
步骤3：使用多粒度卷积，抽取不同维度的低级特征，更加提升模型特征抽取能力；
步骤4：通过胶囊神经网络来挖掘实体间深层次关系，从而补全知识图谱并提高知识准确性；
步骤5：将步骤2中实体关系的编码作为外部知识与文本实体信息进行融合；
步骤6：使用自注意力机制将知识向量与文本上下文交互，通过多层感知机得出答案。

2.根据权利要求1所述的基于外部知识嵌入的文本理解方法，其特征是：所述步骤1中的聚类算法采用K-Means聚类算法将知识图谱中的实体集合划分为多组，然后从正例三元组中头实体所在的簇中选择一个实体替换，并用同样的方法来替换尾实体，从而在数据集中加入负例；K-Means聚类算法公式为：

其中k为类别数，x为实体集合S中的样本，μi为第i类的质心。

3.根据权利要求1所述的基于外部知识嵌入的文本理解方法，其特征是：所述步骤2中的BERT网络将输入实体替换成其实体概念，从而在编码过程中获取包含更丰富语义信息的表征向量；其输入形式可表示为：
[‘[CLS]’,‘TokH1’,‘TokH2’,‘…’,‘TokHn’,’[SEP]’,’TokR’,’[SEP]’,’TokT1’,’TokT2’,’…’,’TokTm’]
其中’[CLS]’表示为BERT中用于句子分类的token，‘[CLS]’的最终输出能够代表整个句子的信息被用在文本分类任务中，‘[SEP]’表示为BERT中用于句子分割的token，能够告诉BERT模型句子之间的相关程度，‘TokHn’表示头向量的单词，‘TokR’表示关系的单词，‘TokTm’表示尾向量的单词。

4.根据权利要求1所述的基于外部知识嵌入的文本理解方...

【专利技术属性】
技术研发人员：何慧华，
申请(专利权)人：苏州元启创人工智能科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人