一种多轮对话改写方法、装置和电子设备制造方法及图纸

技术编号:28942062 阅读:40 留言:0更新日期:2021-06-18 21:48
本申请公开了一种多轮对话改写方法、装置和电子设备,该方法和装置具体为获取用户与系统的基础对话内容和待改写对话内容;将基础对话内容和待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置;根据改写位置判断是否需要改写;如果需要改写,则将改写内容拼接于改写位置,得到改写后的目标语句。通过最终的拼接改写,使得到的目标语句避免了信息缺失和指代有歧义,避免了在多轮对话时对机器理解语言的影响,从而提升了多轮对话的效果。

【技术实现步骤摘要】
一种多轮对话改写方法、装置和电子设备
本申请涉及人工智能
,更具体地说,涉及一种多轮对话改写方法、装置和电子设备。
技术介绍
在基于对自然语音处理的应用领域中,在与基于自然语言处理进行工作的集群进行多回合的对话中,由于人们常常有一些口语化的表达,造成对话中会出现信息缺失和指代有歧义的情况,从而影响机器对语言的理解,最终导致多轮对话的效果欠佳。因此如何提升多轮对话的效果一直是学术界和工程界研究的热门方向,目前来看还没有人能够提出改善多轮对话效果的方案。
技术实现思路
有鉴于此,本申请提供一种多轮对话改写方法、装置和电子设备,用于改善多轮对话的效果。为了实现上述目的,现提出的方案如下:一种多轮对话改写方法,应用于电子设备,所述多轮对话改写方法包括步骤:获取用户与系统的基础对话内容和待改写对话内容;将所述基础对话内容和所述待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置;根据所述改写位置判断是否需要改写;如果需要改写,则将所述改写内容拼接于所述改写位置,得到改写后的目标语句。可选的,所述将所述基础对话内容和所述待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置,包括步骤:将所述基础对话内容和所述待改写对话内容按预设规律进行连接;提取所述基础对话内容和所述待改写对话内容的内容特征;将所述内容特征输入所述神经网络模型,得到所述改写内容和所述改写位置。可选的,所述改写内容和所述改写位置均指向所述基础对话内容。可选的,所述基础对话内容包括用户对话内容和系统对话内容。可选的,所述将所述改写内容拼接于所述改写位置,包括步骤:将所述改写内容补全到所述改写位置,得到所述改写后的目标语句;或者,将所述改写内容替换掉所述改写位置的指代词,得到所述改写后的目标语句。一种多轮对话改写装置,应用于电子设备,所述多轮对话改写装置包括:内容获取模块,用于获取用户与系统的基础对话内容和待改写对话内容;模型处理模块,用于将所述基础对话内容和所述待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置;根据所述改写位置判断是否需要改写;改写处理模块,用于如果需要改写,则将所述改写内容拼接于所述改写位置,得到改写后的目标语句。可选的,所述模型处理模块包括:拼接处理单元,用于将所述基础对话内容和所述待改写对话内容按预设规律进行连接;特征提取单元,用于提取所述基础对话内容和所述待改写对话内容的内容特征;处理执行单元,用于将所述内容特征输入所述神经网络模型,得到所述改写内容和所述改写位置。可选的,所述改写内容和所述改写位置均指向所述基础对话内容。可选的,所述基础对话内容包括用户对话内容和系统对话内容。可选的,所述改写处理模块包括:第一改写单元,用于将所述改写内容补全到所述改写位置,得到所述改写后的目标语句;第二改写单元,用于将所述改写内容替换掉所述改写位置的指代词,得到所述改写后的目标语句。一种电子设备,设置有如上所述的多轮对话改写装置。一种电子设备,包括至少一个处理器和与所述处理器连接的存储器,其中:所述存储器用于存储计算机程序或指令;所述处理器用于执行所述计算机程序或指令,以使所述电子设备执行如上所述的多轮对话改写方法。从上述的技术方案可以看出,本申请公开了一种多轮对话改写方法、装置和电子设备,该方法和装置具体为获取用户与系统的基础对话内容和待改写对话内容;将基础对话内容和待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置;根据改写位置判断是否需要改写;如果需要改写,则将改写内容拼接于改写位置,得到改写后的目标语句。通过最终的拼接改写,使得到的目标语句避免了信息缺失和指代有歧义,避免了在多轮对话时对机器理解语言的影响,从而提升了多轮对话的效果。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例的一种多轮对话改写方法的流程图;图2为本申请实施例的对话内容示意图;图3为本申请实施例的模型结构示意图;图4为本申请实施例的指代消歧示意图;图5为本申请实施例的信息补全示意图;图6为本申请实施例的一种多轮对话改写装置的框图;图7为本申请实施例的一种电子设备的框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在基于机器对话的多轮对话过程中,由于人们常常有些口语化表达,造成对话中经常出现信息缺失或者指代歧义的情况,为此本申请提供如下具体的方案,以便提高多轮对话的效果。实施例一图1为本申请实施例的一种多轮对话改写方法的流程图。如图1所示,本实施例提供的多轮对话改写方法应用于与用户进行对话的电子设备,电子设备可以理解为计算机或与用户进行对话的机器,该多轮对话改写方法包括如下步骤:S1、获取用户与系统的基础对话内容和待改写对话内容。这里基础对话内容是指用户与系统刚开始阶段时,所进行的包含有较为全面信息内容的对话,包括用户发起的对话A1和系统的回话B1,如图2所示,这里的待改写对话内容就是后续的A2。S2、利用神经网络模型对基础对话内容和待改写对话内容进行处理。即将上述获取的基础对话内容和待改写对话内容输入到预先训练好的神经网络模型中进行处理,从而得到需要进行改写的改写内容和改写位置。本申请中的神经网络模型为基于Transformer机构的神经网络模型。在具体执行时,通过如下步骤实现对基础对话内容和待改写对话内容的处理:首先,将基础对话内容和待改写内容按预设规律进行连接,即将基础对话内容和待改写对话内容按A1B1A2的格式组成相应组织形式。并将该组织形式的内容输入到基于Transformer结构的bert或rbt3编码器进行处理。然后,上述基于Transformer结构的bert或rbt3编码器通过特征提取,得到其中的文本特征;最后,该神经网络模型输出上述的改写内容和改写位置。该模型结构及输出如图3所示,其中包括五个指针,分别为关键信息start、关键信息end、改写位置、指代start和指代end。S3、根据改写位置判断是否需要改写。即对本文档来自技高网...

【技术保护点】
1.一种多轮对话改写方法,应用于电子设备,其特征在于,所述多轮对话改写方法包括步骤:/n获取用户与系统的基础对话内容和待改写对话内容;/n将所述基础对话内容和所述待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置;/n根据所述改写位置判断是否需要改写;/n如果需要改写,则将所述改写内容拼接于所述改写位置,得到改写后的目标语句。/n

【技术特征摘要】
1.一种多轮对话改写方法,应用于电子设备,其特征在于,所述多轮对话改写方法包括步骤:
获取用户与系统的基础对话内容和待改写对话内容;
将所述基础对话内容和所述待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置;
根据所述改写位置判断是否需要改写;
如果需要改写,则将所述改写内容拼接于所述改写位置,得到改写后的目标语句。


2.如权利要求1所述的多轮对话改写方法,其特征在于,所述将所述基础对话内容和所述待改写对话内容输入基于Transformer结构的神经网络模型,得到改写内容和改写位置,包括步骤:
将所述基础对话内容和所述待改写对话内容按预设规律进行连接;
提取所述基础对话内容和所述待改写对话内容的内容特征;
将所述内容特征输入所述神经网络模型,得到所述改写内容和所述改写位置。


3.如权利要求2所述的多轮对话改写方法,其特征在于,所述改写内容和所述改写位置均指向所述基础对话内容。


4.如权利要求1所述的多轮对话改写方法,其特征在于,所述基础对话内容包括用户对话内容和系统对话内容。


5.如权利要求1所述的多轮对话改写方法,其特征在于,所述将所述改写内容拼接于所述改写位置,包括步骤:
将所述改写内容补全到所述改写位置,得到所述改写后的目标语句;
或者,将所述改写内容替换掉所述改写位置的指代词,得到所述改写后的目标语句。


6.一种多轮对话改写装置,应用于电子设备,其特征在于,所述多轮对话改写装置包括:
内容获取模块,用于获取用户与系统的基础对话内容和待改写对话内容;
模型处理模块,用于将所述基础...

【专利技术属性】
技术研发人员:李弼君金忠孝
申请(专利权)人:上海汽车集团股份有限公司上海汽车工业集团总公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1