当前位置: 首页 > 专利查询>清华大学专利>正文

基于故事续写和动态知识库的对话生成方法及系统技术方案

技术编号:36955675 阅读:64 留言:0更新日期:2023-03-22 19:16
本申请提出一种基于故事续写和动态知识库的对话生成方法及系统,该方法包括:获取用户输入的初始故事,并从初始故事中确定对话角色;构建知识库,从初始故事中抽取出与对话角色相关的知识存入知识库,并获取与知识库中已有知识相关的外部补充知识,以对知识库进行更新;基于更新后的知识库中的知识和初始故事,生成与用户交互的对话,并获取用户返回的对话;抽取对话内容中的事件知识,并基于初始故事和事件知识进行故事续写,将续写后的故事存入知识库;基于续写后的故事,循环进行知识库的更新、与用户的交互对话和故事续写,直至对话结束。该方法基于动态知识库和角色故事续写的框架生成对话,提高了与AI对话的拟真度和趣味性。味性。味性。

【技术实现步骤摘要】
基于故事续写和动态知识库的对话生成方法及系统


[0001]本申请涉及自然语言处理
,尤其涉及一种基于故事续写和动态知识库的对话生成方法及系统。

技术介绍

[0002]随着自然语言处理技术的发展,超大规模预训练语言模型的应用率逐渐提高,进而使得各个下游自然语言处理任务得到了更充分的解决。作为自然语言处理的核心任务之一,智能AI机器人与用户之间的对话生成,也开始向拟真度更高、性能更强的方向发展。
[0003]相关技术中,在构建对话系统时,一般是采用知识具象化的对话(Knowledge

grounded Dialogue,简称KGD)构建系统,KGD是在正常的对话系统生成前,合理加入知识相关的语料或文本内容,以提升对话生成结果的信息量以及准确度。
[0004]然而,上述对话生成方式采用的KGD系统的结构一般是构建一个稳定的知识资源池,构建的对话系统的自我成长性不足,在保持长期对话趣味性的能力上不足,很容易使用户失去兴趣,最终放弃对话。并且该方式在生成需要使用的大模型的控制过程中,很容易产生错误传播和逻辑混淆等问题,进一步造成可信度和吸引度下降。
[0005]因此,如何提高对话系统的拟真度和生成内容的趣味度成为目前亟需解决的问题。

技术实现思路

[0006]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0007]为此,本申请的第一个目的在于提出一种基于故事续写和动态知识库的对话生成方法,该方法基于动态知识库和角色故事续写的框架生成对话,提高了与AI对话的拟真度和趣味性。
[0008]本申请的第二个目的在于提出一种基于故事续写和动态知识库的对话生成系统。
[0009]本申请的第三个目的在于提出一种非临时性计算机可读存储介质。
[0010]为达上述目的,本申请的第一方面实施例提出了一种基于故事续写和动态知识库的对话生成方法,包括以下步骤:
[0011]获取用户输入的初始故事,并从所述初始故事中确定对话角色;
[0012]构建知识库,从所述初始故事中抽取出与所述对话角色相关的知识存入所述知识库,并获取与所述知识库中已有知识相关的外部补充知识,以对所述知识库进行更新;
[0013]基于更新后的所述知识库中的知识和所述初始故事,生成与所述用户交互的对话,并获取所述用户返回的对话;
[0014]抽取对话内容中的事件知识,并基于所述初始故事和所述事件知识进行故事续写,将续写后的故事存入所述知识库;
[0015]基于所述续写后的故事,循环进行所述知识库的更新、与所述用户的交互对话和故事续写,直至对话结束。
[0016]可选地,在本申请的一个实施例中,从所述初始故事中抽取出与所述对话角色相关的知识,包括:对预设的预训练模型进行训练,生成信息抽取模型作为抽取器;通过信息抽取模型根据第一抽取任务的纲要从所述初始故事中抽取出与所述对话角色相关的知识三元组。
[0017]可选地,在本申请的一个实施例中,获取与所述知识库中已有知识相关的外部补充知识,包括:从外部知识库中获取所述外部补充知识,或者在互联网中通过外部搜索引擎完成对所述外部补充知识的查找。
[0018]可选地,在本申请的一个实施例中,知识库,包括:结构化知识和非结构化文本,其中,所述结构化知识包括所述与所述对话角色相关的知识三元组和所述外部补充知识,所述非结构化文本是可延伸的故事内容。
[0019]可选地,在本申请的一个实施例中,基于更新后的所述知识库中的知识和所述初始故事,生成与所述用户交互的对话,包括:在机器阅读理解框架下,以预设的预训练语言模型作为基底,通过预设的对话生成框架根据所述知识库中的知识和所述初始故事生成所述对话。
[0020]可选地,在本申请的一个实施例中,抽取对话内容中的事件知识,包括:通过所述信息抽取模型根据第二抽取任务的纲要从所述对话内容中抽取出所述事件知识。
[0021]可选地,在本申请的一个实施例中,基于所述初始故事和所述事件知识进行故事续写,包括:基于所述初始故事和所述事件知识进行后置的掩码预测,通过预训练语言模型进行所述初始故事的延伸和补全。
[0022]为达上述目的,本申请的第二方面实施例提出了一种基于故事续写和动态知识库的对话生成系统,包括以下模块:
[0023]获取模块,用于获取用户输入的初始故事,并从所述初始故事中确定对话角色;
[0024]更新模块,用于构建知识库,从所述初始故事中抽取出与所述对话角色相关的知识存入所述知识库,并获取与所述知识库中已有知识相关的外部补充知识,以对所述知识库进行更新;
[0025]生成模块,用于基于更新后的所述知识库中的知识和所述初始故事,生成与所述用户交互的对话,并获取所述用户返回的对话;
[0026]续写模块,用于抽取对话内容中的事件知识,并基于所述初始故事和所述事件知识进行故事续写,将续写后的故事存入所述知识库;
[0027]循环模块,用于基于所述续写后的故事,循环进行所述知识库的更新、与所述用户的交互对话和故事续写,直至对话结束。
[0028]可选地,在本申请的一个实施例中,更新模块,具体用于:对预设的预训练模型进行训练,生成信息抽取模型作为抽取器;通过信息抽取模型根据第一抽取任务的纲要从所述初始故事中抽取出与所述对话角色相关的知识三元组。
[0029]为了实现上述实施例,本申请第三方面实施例还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的基于故事续写和动态知识库的对话生成方法。
[0030]本申请的实施例提供的技术方案至少带来以下有益效果:本申请先对用户输入的初始背景故事进行抽取,并补充外部知识以构建可以动态更新的知识库。然后根据知识库
内容和故事内容生成对话与用户交互,并对对话内容进行知识抽取,结合原故事进行故事续写。再根据续写的故事更新知识库,进行下一轮的对话生成和交互。通过迭代进行上述过程,实现故事续写和知识库的动态更新。从而,本申请实现基于初始背景故事和动态知识库进行故事续写,并将知识维护、故事续写和对话生成进行合理组合生成对话系统的结构。由此,在构建对话系统的同时,为其后台不断维护一个自增长的动态知识库和延伸的背景故事,从而使得对话系统更加真实,对话内容更加具有新颖性和趣味性,有利于引起用户的兴趣,增长交互时间,提升用户体验。
[0031]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0032]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中
[0033]图1为本申请实施例提出的一种基于故事续写和动态知识库的对话生成方法的流程图;
[0034]图2为本申请实施例提出的一种具体的基于故事续写和动态知识库的对话生成方法的流程图;
[0035]图3为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于故事续写和动态知识库的对话生成方法,其特征在于,包括以下步骤:获取用户输入的初始故事,并从所述初始故事中确定对话角色;构建知识库,从所述初始故事中抽取出与所述对话角色相关的知识存入所述知识库,并获取与所述知识库中已有知识相关的外部补充知识,以对所述知识库进行更新;基于更新后的所述知识库中的知识和所述初始故事,生成与所述用户交互的对话,并获取所述用户返回的对话;抽取对话内容中的事件知识,并基于所述初始故事和所述事件知识进行故事续写,将续写后的故事存入所述知识库;基于所述续写后的故事,循环进行所述知识库的更新、与所述用户的交互对话和故事续写,直至对话结束。2.根据权利要求1所述的对话生成方法,其特征在于,所述从所述初始故事中抽取出与所述对话角色相关的知识,包括:对预设的预训练模型进行训练,生成信息抽取模型作为抽取器;通过信息抽取模型根据第一抽取任务的纲要从所述初始故事中抽取出与所述对话角色相关的知识三元组。3.根据权利要求1所述的对话生成方法,其特征在于,所述获取与所述知识库中已有知识相关的外部补充知识,包括:从外部知识库中获取所述外部补充知识,或者在互联网中通过外部搜索引擎完成对所述外部补充知识的查找。4.根据权利要求2所述的对话生成方法,其特征在于,所述知识库,包括:结构化知识和非结构化文本,其中,所述结构化知识包括所述与所述对话角色相关的知识三元组和所述外部补充知识,所述非结构化文本是可延伸的故事内容。5.根据权利要求1所述的对话生成方法,其特征在于,所述基于更新后的所述知识库中的知识和所述初始故事,生成与所述用户交互的对话,包括:在机器阅读理解框架下,以预设的预训练语言模型作为基底,通过预设的对话生成框架根据所述知识库中的知识和所述初...

【专利技术属性】
技术研发人员:张笑涵于济凡李涓子侯磊
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1