将上下文扩充到知识图谱中的对话生成方法及系统技术方案

技术编号:31162212 阅读:23 留言:0更新日期:2021-12-04 10:32
本发明专利技术公开了将上下文扩充到知识图谱中的对话生成方法及系统,获取当前语句和当前语句的若干条上下文语句;根据当前语句,构建当前语句的知识子图谱;对当前语句的若干条上下文语句进行筛选,筛选出上下文重要语句;根据当前语句的上下文重要语句,从当前语句的知识子图谱筛选出重要词汇;将当前语句的知识子图谱中的非重要词汇删除,得到更新后的知识子图谱;将上下文重要语句分词后得到的词汇与更新后的知识子图谱中的重要词汇进行连接,得到扩充后的知识图谱;基于当前语句和扩充后的知识图谱,生成应答对话语句。根据上下文及知识感知进一步生成信息丰富且流畅的回复。知进一步生成信息丰富且流畅的回复。知进一步生成信息丰富且流畅的回复。

【技术实现步骤摘要】
将上下文扩充到知识图谱中的对话生成方法及系统


[0001]本专利技术涉及对话生成
,特别是涉及将上下文扩充到知识图谱中的对话生成方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]人机对话涉及人类与机器两大主体,对话系统作为两者交流的直接体现,致力于追求对话的流畅性与自然性。近年来不少学者根植于开放领域下对话回复的生成,涉及广泛但成效相对单一,面向主题迁移则较难把握对话的一致性,致力于对话逻辑性则无法涌现更为丰富的信息,把握人物特殊性又很难平衡对话的流畅性。总的来说对话涉及因素较多,重点在于机器能够理解语言背后的知识,并推理出特定对话中的概念,然而仅仅依靠对话数据或简单的实体检索,而不借助背景知识的学习,很难做到真正的语义交互。
[0004]近期,一些研究开始实践通过额外知识的引入促进开放领域下的对话生成,这些模型主要通过非结构化知识或结构化三元组来发挥背景知识的作用,并且实验表明这些先验知识能够增强知识选择模型的泛化能力。特别是知识三元组或图路径,能够有效缩小候选顶点的范围,生成信息更为多样的回答,但由于参与生成局限于一个词或实体,只能从查询消息的表面文本中捕获有限的信息,因此可能会遇到无法生成响应的信息。不同于结构化三元组,上下文中的文本句子包含当前对话的丰富信息,因此相关上下文的参与能够为对话生成提供特定的语境信息。图结构与相关上下文的融合可能会对知识感知以及会话生成产生积极作用,对此的研究较少。
[0005]针对聊天系统中对话回复的信息含量低,倾向于通用回答的特点,近期的研究提出根据知识图检索引入结构化知识。在对话中赋予额外的相关知识显然能够丰富对话生成,但知识检索过程局限于实体词上的检索,忽略了语境中实体的含义,不能全面把握当前对话的特定知识。

技术实现思路

[0006]为了解决现有技术的不足,本专利技术提供了将上下文扩充到知识图谱中的对话生成方法及系统;
[0007]第一方面,本专利技术提供了将上下文扩充到知识图谱中的对话生成方法;
[0008]将上下文扩充到知识图谱中的对话生成方法,包括:
[0009]获取当前语句和当前语句的若干条上下文语句;
[0010]根据当前语句,构建当前语句的知识子图谱;
[0011]对当前语句的若干条上下文语句进行筛选,筛选出上下文重要语句;
[0012]根据当前语句的上下文重要语句,从当前语句的知识子图谱筛选出重要词汇;
[0013]将当前语句的知识子图谱中的非重要词汇删除,得到更新后的知识子图谱;将上下文重要语句分词后得到的词汇与更新后的知识子图谱中的重要词汇进行连接,得到扩充
后的知识图谱;
[0014]基于当前语句和扩充后的知识图谱,生成应答对话语句。
[0015]第二方面,本专利技术提供了将上下文扩充到知识图谱中的对话生成系统;
[0016]将上下文扩充到知识图谱中的对话生成相同,包括:
[0017]获取模块,其被配置为:获取当前语句和当前语句的若干条上下文语句;
[0018]构建模块,其被配置为:根据当前语句,构建当前语句的知识子图谱;
[0019]重要语句筛选模块,其被配置为:对当前语句的若干条上下文语句进行筛选,筛选出上下文重要语句;
[0020]重要词汇筛选模块,其被配置为:根据当前语句的上下文重要语句,从当前语句的知识子图谱筛选出重要词汇;
[0021]扩充模块,其被配置为:将当前语句的知识子图谱中的非重要词汇删除,得到更新后的知识子图谱;将上下文重要语句分词后得到的词汇与更新后的知识子图谱中的重要词汇进行连接,得到扩充后的知识图谱;
[0022]生成模块,其被配置为:基于当前语句和扩充后的知识图谱,生成应答对话语句。
[0023]第三方面,本专利技术还提供了一种电子设备,包括:
[0024]存储器,用于非暂时性存储计算机可读指令;以及
[0025]处理器,用于运行所述计算机可读指令,
[0026]其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。
[0027]第四方面,本专利技术还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。
[0028]与现有技术相比,本专利技术的有益效果是:
[0029]为维持对话的一致性,对话上下文的有效融入与相关知识的引入同样重要。为应对以上问题,围绕当前对话的知识引入,本专利技术提出将上下文扩充到知识图中的对话生成模型(ECKDG),一方面,知识图的扩充是在相关恰当知识上的上下文的连接,恰当知识是针对当前对话特定知识的识别,另一方面,上下文为当前信息高度相关的上下文,上下文重要信息的融入能有效保证会话前后的逻辑一致性。
[0030]其中,对话回复生成中接收的扩充型知识图谱同时包含结构化知识与非结构化上下文信息,为最大效度发挥两者输入的作用,解码生成模块应用摘要提取模型,致力于根据上下文及知识感知进一步生成信息丰富且流畅的回复。同时,从涉及多个角度的实验评估来看,对比目前其他知识感知的对话生成模型,本专利技术模型下所生成回复在多样性及流畅性上均占有优势地位,总体表现突出。
[0031]本专利技术附加方面的优点将在下面的描述中部分给出,或通过本专利技术的实践了解到。
附图说明
[0032]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0033]图1:基于上下文进行知识检索的说明性例子;
[0034]图2:基于上下文进行知识检索的说明性例子;
[0035]图3:本申请实施例一的框架示意图;
[0036]图4:本申请实施例一的方法流程图;
[0037]图5:本申请实施例一的本专利技术方法所涉及的整体计算模型结构图。
具体实施方式
[0038]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本专利技术使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0039]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0040]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0041]本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.将上下文扩充到知识图谱中的对话生成方法,其特征是,包括:获取当前语句和当前语句的若干条上下文语句;根据当前语句,构建当前语句的知识子图谱;对当前语句的若干条上下文语句进行筛选,筛选出上下文重要语句;根据当前语句的上下文重要语句,从当前语句的知识子图谱筛选出重要词汇;将当前语句的知识子图谱中的非重要词汇删除,得到更新后的知识子图谱;将上下文重要语句分词后得到的词汇与更新后的知识子图谱中的重要词汇进行连接,得到扩充后的知识图谱;基于当前语句和扩充后的知识图谱,生成应答对话语句。2.如权利要求1所述的将上下文扩充到知识图谱中的对话生成方法,其特征是,根据当前语句,构建当前语句的知识子图谱;具体包括:对当前语句进行分词处理,得到若干个词汇;将每个词汇与已有知识图谱中的实体进行匹配;如果当前词汇与已有知识图谱中的实体匹配成功,则执行多跳检索,得到当前语句的知识子图谱;所述多跳检索,是指:对当前语句的每个词汇,均在已有知识图谱中进行匹配,将识别成功的实体作为起始节点,按照已有知识图谱中的路径执行多跳推理直至跳到尾节点,将所有被跳过的节点和所有被跳过的路径均记录下来,最终得到当前语句的知识子图谱。3.如权利要求1所述的将上下文扩充到知识图谱中的对话生成方法,其特征是,对当前语句的若干条上下文语句进行筛选,筛选出上下文重要语句;具体包括:基于点互信息算法,计算每一条上下文语句与当前语句中实体间的点互消息值;基于实体间的点互消息值,得到当前上下文语句与当前语句的相关度;将相关度超过设定阈值的若干条上下文语句,作为上下文重要语句筛选出来;将筛选出来的若干条上下文重要语句,按照时间顺序进行编码,得到上下文重要语句的编码向量。4.如权利要求3所述的将上下文扩充到知识图谱中的对话生成方法,其特征是,所述将筛选出来的若干条上下文重要语句,按照时间顺序进行编码,得到上下文重要语句的编码向量,是:采用双向GRU神经网络来实现,将筛选出来的若干条上下文重要语句输入到双向GRU神经网络中,输出上下文重要语句的编码向量。5.如权利要求1所述的将上下文扩充到知识图谱中的对话生成方法,其特征是,根据当前语句的上下文重要语句,从当前语句的知识子图谱筛选出重要词汇;具体包括:将上下文重要语句的编码向量和当前语句的知识子图谱,均输入到恰当知识识别器中,输出当前语句的知识子图谱中每个词汇的权重;将权重高于设定阈值的词汇筛选出来,作为从当前语句的知识子图谱筛选出的重要词汇;其中,恰当知识识别器,采用卷积神经网络来实现...

【专利技术属性】
技术研发人员:解福刘悦刘凤鸣徐传杰于凤洋段成志
申请(专利权)人:山东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1