一种在深度语言模型中融入额外知识信息的方法技术

技术编号：25637139 阅读：23 留言：0更新日期：2020-09-15 21:29

本发明专利技术公开了一种在深度语言模型中融入额外知识信息的方法，其特点是采用将知识信息融入到深度语言模型中进行预训练的方法，通过大规模自然语言语料上进行实体标注，并对自然语言文本进行实体级别的扰动构造负样本用以强化和提升知识库问答系统中关系匹配模块的性能，模型的训练和知识融入具体包括：构建词表、识别实体信息、创建训练所需的负样本和预训练深度语言模型步骤。本发明专利技术与现有技术相比具有将结构化知识信息引入深度语言模型的参数中，使得模型具备针对自然语言输入文本进行包含事实性结构化信息的语义理解，在对应任务上获得性能提升，方法简便，效率高。

全部详细技术资料下载

【技术实现步骤摘要】
一种在深度语言模型中融入额外知识信息的方法
本专利技术涉及计算机问答系统
，尤其是一种基于知识图谱在深度语言模型中融入额外知识信息的方法。
技术介绍
自然语言处理旨在研究使用计算机自动处理、理解与生成自然语言的技术。问答系统是自然语言处理中的一个重要的子领域，旨在针对用户输入的问题通过计算机自动给出回答。问答系统分为多种类型，包括基于阅读理解的问答系统，基于社区检索的问答系统以及基于知识库的问答系统；基于阅读理解的问答系统通过在给定的文章片段中搜索潜在的答案来回答相关的问题；基于社区检索的问答系统通过一个检索系统查询社区中可能相关的回答或者文本片段，并对所有的候选回答根据上下文与给定信息进行重排序来回答用户输入的问题；以及基于知识库的问答系统通过在一个给定的知识库中确定检索子图查询范围并且在子图中搜索最为相关的实体，将这些候选实体作为针对问题的事实性回答返回给用户。知识库是指将一系列事实等信息通过结构化存储方法保存的数据库。一般情况下，这些事实信息通过“实体-谓词-实体”的三元组形式保存。不同的实体之间通过各种关系谓词相互连接，形成了一种网状的图结构为知识图谱。知识库在多个领域有着广泛的应用，在自然语言处理领域，常常通过引入知识库来在编码器阶段引入额外的事实性信息，从而提高神经网络在自然语言处理任务上的性能。近年来，BERT、ELMo等深度语言模型极大地影响了自然语言处理领域的模型设计。这些深度语言模型的特点是拥有极大的参数量，同时有着数目庞大的预训练语料，通过语言模型等无监督任务来自动编码自然

【技术保护点】
1.一种在深度语言模型中融入额外知识信息的方法，其特征在于采用将知识信息融入到深度语言模型中进行预训练的方法，用以强化和提升知识库问答系统中关系匹配模块的性能，模型的训练和知识融入包括以下具体步骤：/n步骤一：构建实体到指称的词表/n采用知识库或富含人工标注的超链接文本，构建实体指称到实体的词表；/n步骤二：识别文本中的实体信息/n利用构建的词表对自然语言文本进行标注，识别文本中的实体信息，并链接到知识库中所对应的实体中为训练正样本；/n步骤三：创建训练所需的负样本/n根据实体链接后所得到的结构化信息，对自然语言文本进行扰动，创建训练所需的负样本；/n步骤四：预训练深度语言模型参数/n使用创建的负样本为新训练集进行预训练深度语言模型参数，并对所获得的训练集对深度语言模型进行无监督预训练，以将知识信息融入到模型参数中强化其性能。/n

【技术特征摘要】
1.一种在深度语言模型中融入额外知识信息的方法，其特征在于采用将知识信息融入到深度语言模型中进行预训练的方法，用以强化和提升知识库问答系统中关系匹配模块的性能，模型的训练和知识融入包括以下具体步骤：
步骤一：构建实体到指称的词表
采用知识库或富含人工标注的超链接文本，构建实体指称到实体的词表；
步骤二：识别文本中的实体信息
利用构建的词表对自然语言文本进行标注，识别文本中的实体信息，并链接到知识库中所对应的实体中为训练正样本；
步骤三：创建训练所需的负样本
根据实体链接后所得到的结构化信息，对自然语言文本进行扰动，创建训练所需的负样本；
步骤四：预训练深度语言模型参数<...

【专利技术属性】
技术研发人员：杨燕，郑淇，陈成才，贺樑，
申请(专利权)人：华东师范大学，上海智臻智能网络科技股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人