基于外部知识增强的机器阅读理解方法、系统、装置制造方法及图纸

技术编号：23983646 阅读：27 留言：0更新日期：2020-04-29 12:29

本发明专利技术属于自然语言处理技术领域，具体涉及一种基于外部知识增强的机器阅读理解方法、系统、装置，旨在解决现有机器阅读理解方法未利用三元组间的图结构信息，导致答案预测准确率较低的问题。本系统方法包括生成问题及原文文本中各实体的上下文表示；基于外部知识库，获取问题及原文文本中各实体的三元组集合及原文文本中各实体相邻实体的三元组集合；并基于三元组集合，通过外部知识图谱获取各实体的知识子图；通过图注意力网络更新融合知识子图，获取知识表示；通过哨兵机制将上下文表示和知识表示进行拼接，通过多层感知器和softmax分类器获取待回答问题的答案。本发明专利技术通过利用三元组之间的图结构信息，提高了答案预测的准确率。

Machine reading comprehension method, system and device based on external knowledge enhancement

全部详细技术资料下载

【技术实现步骤摘要】
基于外部知识增强的机器阅读理解方法、系统、装置
本专利技术属于自然语言处理
，具体涉及一种基于外部知识增强的机器阅读理解方法、系统、装置。
技术介绍
机器阅读理解是在自然语言处理中非常重要的一个研究任务。机器阅读理解需要系统通过阅读一篇相关文章，来回答对应的问题。而在阅读理解任务中，利用外部知识是一个相当热门的研究方向。如何在阅读理解系统中使用外部知识也受到了广泛的关注。外部知识的来源主要分为两类，一类是非结构化的外部自然语言语料；另一类则是结构化的知识表示，比如说知识图谱。本专利技术主要关注如何利用结构化的知识表示。结构化的知识图谱中，通常将知识表示成若干个三元组，比如(shortage，related_to，lack)和(need，related_to，lack)。以往利用这类结构化知识时，通常根据阅读理解原文和问题信息检索回相关的三元组集合作为外部知识，然而，在对三元组建模时，只针对单独的三元组建模，即无法捕捉三元组之间的信息，也就是多跳的信息，换句话说，则是未捕捉原有的三元组间的图结构信息。因此，本专利提出一种基于外部知识增强的机器阅读理解模型。
技术实现思路
为了解决现有技术中的上述问题，即为了解决现有机器阅读理解方法未利用外部知识中三元组间的图结构信息，导致答案预测准确率较低的问题，本专利技术第一方面，提出了一种基于外部知识增强的机器阅读理解的方法，该方法包括：步骤S100，获取第一文本、第二文本，并分别生成所述第一文本、所述第二文本中各实体的上下文表示，作为第一...

【技术保护点】
1.一种基于外部知识增强的机器阅读理解方法，其特征在于，该方法包括：/n步骤S100，获取第一文本、第二文本，并分别生成所述第一文本、所述第二文本中各实体的上下文表示，作为第一表示；所述第一文本为待回答问题的文本；所述第二文本为问题对应的阅读理解原文文本；/n步骤S200，基于外部知识库，分别获取所述第一文本、所述第二文本中各实体的三元组集合，及所述第二文本中各实体三元组集合中对应相邻实体的三元组集合，构建三元组集合集；基于所述三元组集合集，通过外部知识图谱获取各实体的知识子图；所述外部知识库为存储实体对应的三元组集合的数据库；所述外部知识图谱为基于知识图谱嵌入表示方法初始化所述外部知识库构建的知识图谱；/n步骤S300，通过图注意力网络融合各实体的知识子图，获取各实体的知识表示，作为第二表示；/n步骤S400，通过哨兵机制将所述第一表示和所述第二表示进行拼接，得到知识增强的文本表示，作为第三表示；基于所述第三表示，基于多层感知器和softmax分类器获取待回答问题对应的答案。/n

【技术特征摘要】
1.一种基于外部知识增强的机器阅读理解方法，其特征在于，该方法包括：
步骤S100，获取第一文本、第二文本，并分别生成所述第一文本、所述第二文本中各实体的上下文表示，作为第一表示；所述第一文本为待回答问题的文本；所述第二文本为问题对应的阅读理解原文文本；
步骤S200，基于外部知识库，分别获取所述第一文本、所述第二文本中各实体的三元组集合，及所述第二文本中各实体三元组集合中对应相邻实体的三元组集合，构建三元组集合集；基于所述三元组集合集，通过外部知识图谱获取各实体的知识子图；所述外部知识库为存储实体对应的三元组集合的数据库；所述外部知识图谱为基于知识图谱嵌入表示方法初始化所述外部知识库构建的知识图谱；
步骤S300，通过图注意力网络融合各实体的知识子图，获取各实体的知识表示，作为第二表示；
步骤S400，通过哨兵机制将所述第一表示和所述第二表示进行拼接，得到知识增强的文本表示，作为第三表示；基于所述第三表示，基于多层感知器和softmax分类器获取待回答问题对应的答案。

2.根据权利要求1所述的基于外部知识增强的机器阅读理解方法，其特征在于，步骤S100中“分别生成所述第一文本、所述第二文本中各实体的上下文表示”其方法为：通过BERT模型分别生成所述第一文本、所述第二文本中各实体的上下文表示。

3.根据权利要求1所述的基于外部知识增强的机器阅读理解方法，其特征在于，所述第二文本中各实体三元组集合中对应相邻实体的三元组集合，其包括以所述相邻实体为head实体或tail实体的三元组集合。

4.根据权利要求1所述的基于外部知识增强的机器阅读理解方法，其特征在于，步骤S200中“基于知识图谱嵌入表示方法初始化所述外部知识库构建的知识图谱”，其方法为：通过Dismult模型初始化所述外部知识库，构建知识图谱。

5.根据权利要求1所述的基于外部知识增强的机器阅读理解方法，其特征在于，步骤S300中“通过图注意力网络融合各实体的知识子图”，其方法为：通过图注意力网络更新融合各实体知识子图中的节点；更新融合方法如下：

其中，hj为知识子图中j节点的表示，αn为注意力机制算得的归一化的概率得分，tn为j节点邻居节点的表示，βn为与第n个邻居节点的逻辑得分，βj为与第j...

【专利技术属性】
技术研发人员：刘康，张元哲，赵军，丘德来，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人