将上下文扩充到知识图谱中的对话生成方法及系统技术方案

技术编号：31162212 阅读：23 留言：0更新日期：2021-12-04 10:32

本发明专利技术公开了将上下文扩充到知识图谱中的对话生成方法及系统，获取当前语句和当前语句的若干条上下文语句；根据当前语句，构建当前语句的知识子图谱；对当前语句的若干条上下文语句进行筛选，筛选出上下文重要语句；根据当前语句的上下文重要语句，从当前语句的知识子图谱筛选出重要词汇；将当前语句的知识子图谱中的非重要词汇删除，得到更新后的知识子图谱；将上下文重要语句分词后得到的词汇与更新后的知识子图谱中的重要词汇进行连接，得到扩充后的知识图谱；基于当前语句和扩充后的知识图谱，生成应答对话语句。根据上下文及知识感知进一步生成信息丰富且流畅的回复。知进一步生成信息丰富且流畅的回复。知进一步生成信息丰富且流畅的回复。

全部详细技术资料下载

【技术实现步骤摘要】
将上下文扩充到知识图谱中的对话生成方法及系统

[0001]本专利技术涉及对话生成
，特别是涉及将上下文扩充到知识图谱中的对话生成方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
，并不必然构成现有技术。
[0003]人机对话涉及人类与机器两大主体，对话系统作为两者交流的直接体现，致力于追求对话的流畅性与自然性。近年来不少学者根植于开放领域下对话回复的生成，涉及广泛但成效相对单一，面向主题迁移则较难把握对话的一致性，致力于对话逻辑性则无法涌现更为丰富的信息，把握人物特殊性又很难平衡对话的流畅性。总的来说对话涉及因素较多，重点在于机器能够理解语言背后的知识，并推理出特定对话中的概念，然而仅仅依靠对话数据或简单的实体检索，而不借助背景知识的学习，很难做到真正的语义交互。
[0004]近期，一些研究开始实践通过额外知识的引入促进开放领域下的对话生成，这些模型主要通过非结构化知识或结构化三元组来发挥背景知识的作用，并且实验表明这些先验知识能够增强知识选择模型的泛化能力。特别是知识三元组或图路径，能够有效缩小候选顶点的范围，生成信息更为多样的回答，但由于参与生成局限于一个词或实体，只能从查询消息的表面文本中捕获有限的信息，因此可能会遇到无法生成响应的信息。不同于结构化三元组，上下文中的文本句子包含当前对话的丰富信息，因此相关上下文的参与能够为对话生成提供特定的语境信息。图结构与相关上下文的融合可能会对知识感知以及会话生成产生积极作用，对此的研究较少。
[0005]...

【技术保护点】

【技术特征摘要】
1.将上下文扩充到知识图谱中的对话生成方法，其特征是，包括：获取当前语句和当前语句的若干条上下文语句；根据当前语句，构建当前语句的知识子图谱；对当前语句的若干条上下文语句进行筛选，筛选出上下文重要语句；根据当前语句的上下文重要语句，从当前语句的知识子图谱筛选出重要词汇；将当前语句的知识子图谱中的非重要词汇删除，得到更新后的知识子图谱；将上下文重要语句分词后得到的词汇与更新后的知识子图谱中的重要词汇进行连接，得到扩充后的知识图谱；基于当前语句和扩充后的知识图谱，生成应答对话语句。2.如权利要求1所述的将上下文扩充到知识图谱中的对话生成方法，其特征是，根据当前语句，构建当前语句的知识子图谱；具体包括：对当前语句进行分词处理，得到若干个词汇；将每个词汇与已有知识图谱中的实体进行匹配；如果当前词汇与已有知识图谱中的实体匹配成功，则执行多跳检索，得到当前语句的知识子图谱；所述多跳检索，是指：对当前语句的每个词汇，均在已有知识图谱中进行匹配，将识别成功的实体作为起始节点，按照已有知识图谱中的路径执行多跳推理直至跳到尾节点，将所有被跳过的节点和所有被跳过的路径均记录下来，最终得到当前语句的知识子图谱。3.如权利要求1所述的将上下文扩充到知识图谱中的对话生成方法，其特征是，对当前语句的若干条上下文语句进行筛选，筛选出上下文重要语句；具体包括：基于点互信息算法，计算每一条上下文语句与当前语句中实体间的点互消息值；基于实体间的点互消息值，得到当前上下文语句与当前语句的相关度；将相关度超过设定阈值的若干条上下文语句，作为上下文重要语句筛选出来；将筛选出来的若干条上下文重要语句，按照时间顺序进行编码，得到上下文重要语句的编码向量。4.如权利要求3所述的将上下文扩充到知识图谱中的对话生成方法，其特征是，所述将筛选出来的若干条上下文重要语句，按照时间顺序进行编码，得到上下文重要语句的编码向量，是：采用双向GRU神经网络来实现，将筛选出来的若干条上下文重要语句输入到双向GRU神经网络中，输出上下文重要语句的编码向量。5.如权利要求1所述的将上下文扩充到知识图谱中的对话生成方法，其特征是，根据当前语句的上下文重要语句，从当前语句的知识子图谱筛选出重要词汇；具体包括：将上下文重要语句的编码向量和当前语句的知识子图谱，均输入到恰当知识识别器中，输出当前语句的知识子图谱中每个词汇的权重；将权重高于设定阈值的词汇筛选出来，作为从当前语句的知识子图谱筛选出的重要词汇；其中，恰当知识识别器，采用卷积神经网络来实现...

【专利技术属性】
技术研发人员：解福，刘悦，刘凤鸣，徐传杰，于凤洋，段成志，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人