一种对话生成方法、装置及计算机设备制造方法及图纸

技术编号:24756413 阅读:23 留言:0更新日期:2020-07-04 09:13
本申请适用数据处理技术领域,提供了一种对话生成方法、装置及计算机设备,所述方法包括:S1、获取对话生成模型和输入语句;S2、将输入语句输入对话生成模型,得到答复语句并记录在预设存储空间;S3、判断预设存储空间中记录的答复语句是否符合预设中止条件,若是,则执行步骤S5,若否,则执行步骤S4;S4、根据答复语句计算奖励值,根据奖励值以及强化学习的损失函数计算对话生成模型的损失值,根据损失值对对话生成模型进行更新,并将答复语句作为新的输入语句,返回步骤S2;S5、将预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。本申请可以解决现有技术中难以合理得到用户会话信息的问题。

A dialogue generation method, device and computer equipment

【技术实现步骤摘要】
一种对话生成方法、装置及计算机设备
本申请属于数据处理
,尤其涉及一种对话生成方法、装置及计算机设备。
技术介绍
随着大数据产业的发展,越来越多的企业需要收集用户会话信息,将这些用户会话信息应用于各种下游业务中,例如客服机器人等业务。但是,由于政策的严格管控,不允许各个企业随意交易用户会话信息,导致有的企业采集用户会话信息的渠道少,无法获取到大量的用户会话信息以支撑各种下游业务中,例如,如果只有少量的用户会话信息作为训练样本,会导致客服机器人的回答准确性低。因此,如何合理地得到更多的用户会话信息成为了本领域技术人员亟需解决的技术问题。
技术实现思路
有鉴于此,本申请实施例提供了一种对话生成方法、装置及计算机设备,以解决现有技术中难以合理得到用户会话信息的问题。本申请实施例的第一方面提供了一种对话生成方法,包括:S1、获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;S2、将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;S3、判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则执行步骤S5,若否,则执行步骤S4;S4、根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句,返回步骤S2;S5、将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。本申请实施例的第二方面提供了一种对话生成装置,包括:初始获取模块,用于获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;语句生成模块,用于将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;条件判断模块,用于判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则触发语句输出模块,若否,则触发更新返回模块;更新返回模块,用于根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句输入更新后的对话生成模型,触发语句生成模块;语句输出模块,用于将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。本申请实施例的第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在计算机设备上运行时,使得计算机设备实现如上述方法的步骤。本申请实施例与现有技术相比存在的有益效果是:本申请的对话生成方法中,将输入语句输入对话生成模型得到答复语句,并模拟人类对话的过程,将得到的答复语句作为新的输入语句重新输入至对话生成模型中,执行下一次对话生成操作,重复生成对话直至已生成的答复语句满足预设中止条件,从而模拟人类对话的过程得到用户会话信息。并且,为了避免对话陷入无意义的死循环,还在将新的输入语句重新输入对话生成模型之前,计算答复语句的奖励值,根据奖励值以及强化学习的损失函数计算对话生成模型的损失值,根据损失值对对话生成模型进行更新,然后再将新的输入语句输入更新后的对话生成模型,以强化学习的方式确保每一次生成的对话都具有较高的质量,可以广泛应用于各类需要使用用户会话信息的下游业务中,解决了现有技术中难以合理得到用户会话信息的问题。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的对话生成方法的流程示意图;图2是本申请实施例提供的对话生成装置的结构示意图;图3是本申请实施例提供的计算机设备的结构示意图;图4是本申请实施例提供的语义分析器的原理示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。实施例一:下面对本申请实施例一提供的一种对话生成方法进行描述,请参阅附图1,本申请实施例一中的对话生成方法包括:步骤S101、获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;当需要进行用户会话模拟时,可以先获取对话生成模型和输入语句。对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型,对话生成模型可以使用已有的用户会话信息进行预训练。输入语句可以从存储有用户会话信息的数据库中随机选取。对话生成模型的结构可以根据实际情况进行设计。在一些可能的实现方式中,可以选用seq2seq模型作为对话生成模型。seq2seq模型中的解码器和编码器的网络结构可以选用transformer模型,使用transfo本文档来自技高网...

【技术保护点】
1.一种对话生成方法,其特征在于,包括:/nS1、获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;/nS2、将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;/nS3、判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则执行步骤S5,若否,则执行步骤S4;/nS4、根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句,返回步骤S2;/nS5、将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。/n

【技术特征摘要】
1.一种对话生成方法,其特征在于,包括:
S1、获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;
S2、将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;
S3、判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则执行步骤S5,若否,则执行步骤S4;
S4、根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句,返回步骤S2;
S5、将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。


2.如权利要求1所述的对话生成方法,其特征在于,所述将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间具体包括:
S21、将所述输入语句输入预设的二分类器,根据所述二分类器的分类结果判断所述输入语句是否需要进行SQL查询,若是,则执行S22,若否,则执行S24;
S22、将所述输入语句输入语义分析器中,得到与所述输入语句对应的SQL查询语句;
S23、根据所述SQL查询语句对预设的数据库进行查询,若查询到与所述SQL查询语句对应的查询结果,则将所述输入语句和所述查询结果输入所述对话生成模型中,得到答复语句并记录在预设存储空间;
S24、将所述输入语句输入所述对话生成模型中,得到答复语句并记录在预设存储空间。


3.如权利要求2所述的对话生成方法,其特征在于,所述将所述输入语句输入语义分析器中,得到与所述输入语句对应的SQL查询语句具体包括
S221、将所述输入语句输入语义分析器的编码器,得到输入向量,其中,所述语义分析器包括所述编码器、解码器和通道选择器;
S222、将所述输入向量输入所述解码器;
S223、在每一个查询步长中,获取所述通道选择器生成的通道信息,在所述解码器中选择与所述通道信息对应的查询通道对所述输入向量进行处理,得到所述查询步长对应的SQL查询词,其中,所述解码器包括列名查询通道、关键字查询通道和值查询通道,所述通道选择器用于在每一个查询步长中生成相应的通道信息;
S224、将各个查询步长对应的SQL查询词按照生成顺序进行排列,得到与所述输入语句对应的SQL查询语句。


4.如权利要求1所述的对话生成方法,其特征在于,所述对话生成模型具体为seq2seq模型。


5.一种对话生成装置,其特征在于,包括:
初始获取模块,用于获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;
语句生成模块,用于将所述输入语句输入所述...

【专利技术属性】
技术研发人员:于凤英王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1