对话处理方法、模型训练方法及其相关设备技术

技术编号:24756392 阅读:27 留言:0更新日期:2020-07-04 09:13
本申请公开了一种对话处理方法、模型训练方法及其相关设备。其中,该对话处理方法包括:获取至少一条用户输入数据;提取所述至少一条用户输入数据的意图和实体;将所述意图和实体输入至对话处理模型中处理,得到与所述用户输入数据匹配的回复数据;将所述回复数据反馈给用户。上述方案,能够提高设备与用户之间交互的准确性。

Dialogue processing method, model training method and related equipment

【技术实现步骤摘要】
对话处理方法、模型训练方法及其相关设备
本申请涉及数据处理领域,特别是涉及一种对话处理方法、模型训练方法及其相关设备。
技术介绍
随着人工智能的高速发展,聊天机器人是近年来重点研究的方向。苹果的Siri如今已经变得家喻户晓,微软的小冰2014年进入中国以来已经成为百万中国用户的数字伙伴,阿里的店小蜜如今已经为千万卖家服务,为其充当智能客服。多轮对话作为一种对话管理(DialogManagement,DM)过程是聊天机器人中重要的一环。DM控制着人机对话的过程,根据对话历史信息,决定此刻对用户的回复。目前大多数公司的多轮对话处理方式,一种主要是通过规则的方式来实现的,即通过有限状态机来实现,状态和下一步动作都定义好了,当状态满足时,进行下一步动作,进入相应的节点。故基于规则实现的多轮对话必须严格按照流程的方向来执行,缺乏灵活性。例如订飞机票功能,设置的规则是先询问出发地目的地,再在询问时间,这个顺序,如果用户先回答时间,对话处理系统就无法识别,进而无法与用户进行正常交互。另一种是通过对用户输入文本进行分词,并基于分词结果生成对用户的回复。然而,此种仅基于简单分词实现对话处理的方式,会导致设备生成的用户回复不够准确,进而导致设备与用户之间的交互出错。
技术实现思路
本申请主要解决的技术问题是提供一种对话处理方法、模型训练方法及其相关设备,能够提高设备与用户之间交互的准确性。为了解决上述问题,本申请第一方面提供了一种对话处理方法,包括:获取至少一条用户输入数据;提取所述至少一条用户输入数据的意图和实体;将所述意图和实体输入至对话处理模型中处理,得到与所述用户输入数据匹配的回复数据;将所述回复数据反馈给用户。为了解决上述问题,本申请第二方面提供了一种用于对话处理的模型训练方法,包括:获取至少一组历史对话数据,并基于所述历史对话数据中历史用户数据的意图和实体得到训练数据;利用所述训练数据对预设机器学习模型进行训练,建立初始模型;将测试用户数据输入到所述初始模型中,得到测试回复数据;利用所述预测回复构建损失函数,通过所述损失函数确定是否对所述初始模型进行再训练,并将训练完成的模型确定为所述对话处理模型。为了解决上述问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器;所述处理器用于执行所述存储器存储的程序指令,以实现上述第一方面的方法;或者,所述处理器用于执行所述存储器存储的程序指令,以实现上述第二方面的方法。为了解决上述问题,本申请第四方面提供了一种存储装置,存储有能够被处理器运行的程序指令,所述程序指令用于实现上述第一方面和/或第二方面的方法。上述方案中,通过将用户输入数据的意图和实体输入至对话处理模型进行对话处理,以得到匹配的回复数据,由此可实现设备与用户之间的智能交互,且基于用户输入数据的意图和实体实现该对话处理,能够提高设备对用户输入数据内容的意图识别,进而可得到准确率更高的回复数据,故提高设备与用户交互的准确性。另外,通过历史用户输入数据的意图和实体训练得到对话处理模型,进而使得可利用该对话处理模型能够基于用户输入数据的意图和实体生成准确的回复数据,提高设备与用户交互的准确性。附图说明图1是本申请对话处理方法一实施例的流程示意图;图2是本申请对话处理方法另一实施例的流程示意图;图3是本申请用于对话处理的模型训练方法一实施例的流程示意图;图4是本申请对话处理方法中另一实施例中关于步骤S320的流程示意图;图5是本申请电子设备一实施例的结构示意图;图6是本申请存储装置一实施例的结构示意图;图7是本申请对话处理装置一实施例的结构示意图;图8是本申请用于对话处理的模型训练装置一实施例的结构示意图。具体实施方式下面结合说明书附图,对本申请实施例的方案进行详细说明。以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。本申请提出一种将用户输入数据的意图和实体作为对话处理模型的输入,以产生与用户输入数据匹配的回复,进而实现设备与用户之间的智能交互,故实现了对话管理。而且,生成回复的对话处理模型可是基于历史对话数据中的意图和实体对机器学习模型训练得到,相比于基于固定规则实现回复的方式,提高了设备与用户交互的灵活性。本文的机器学习模型具体可以为深度学习模型或强化学习模型等,为便于说明,下面统一以采用深度学习模型进行对话处理来举例描述,采用强化学习模型进行对话处理同理。首先,对本文所出现的词语进行说明:意图:是指用户输入数据所表达的用户目的,例如用户输入数据为:我想订中餐。其意图即为:订餐。实体,是指用户输入数据中的关键要素,例如为词槽。具体如,餐食类实体有:中餐、西餐、川菜等,城市类实体有:北京、上海,深圳等。若用户输入数据为:我想订中餐。其实体即为:中餐。长短期记忆网络(LongShort-TermMemory,LSTM),是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。请参阅图1,图1是本申请对话处理方法一实施例的流程示意图。本实施例中,该方法由具有处理能力的电子设备执行,例如电脑、手机等终端或者服务器等。本实施例中,该方法包括以下步骤:S110:获取至少一条用户输入数据。例如,该电子设备为服务器,服务器通过网络接收到用户通过其用户设备输入的用户输入数据。其中,该用户输入数据可以为语音格式或者文本格式,具体可以为自然语言的语句。当电子设备接收到语音格式的用户输入数据时,先对该用户输入数据进行语音识别得到对应的文本格式的数据。其中,S110获取的用户输入数据可以包括属于同一轮对话流中的一条或多条用户输入数据。若仅包括一条用户输入数据时,该S110获取的用户输入数据为当前用户输入数据。若包括多条用户输入数据时,该S110获取的多条用户输入数据包括当前用户输入数据和至少一条历史用户输入数据。其中,所述一轮对话流可以包括多轮用户与设备之间的一来一往的对话,电子设备可通过判断用户是否在预设时间内继续输入数据,或者输入数据与之前输入数据是否相关,来确定该轮对话流是否结束。该当前用户输入数据为在对话流中最新收到的用户输入的数据,该至少一条历史用户输入数据可以但不限为在当前用户输入数据之前的一条或多条用户输入数据。S120:提取至少一条用户输入数据的意图和实体。其中,可利用意图模型提取得到用户输入数据中的意图,利用实体模型提取得到用户输入数据中的实体。该意图模型和实体模型可以是利用对应的意图数本文档来自技高网...

【技术保护点】
1.一种对话处理方法,其特征在于,包括:/n获取至少一条用户输入数据;/n提取所述至少一条用户输入数据的意图和实体;/n将所述意图和实体输入至对话处理模型中处理,得到与所述用户输入数据匹配的回复数据;/n将所述回复数据反馈给用户。/n

【技术特征摘要】
1.一种对话处理方法,其特征在于,包括:
获取至少一条用户输入数据;
提取所述至少一条用户输入数据的意图和实体;
将所述意图和实体输入至对话处理模型中处理,得到与所述用户输入数据匹配的回复数据;
将所述回复数据反馈给用户。


2.根据权利要求1所述的方法,其特征在于,所述至少一条用户输入数据包括属于同一轮对话流中的当前用户输入数据和至少一条历史用户输入数据;
所述提取所述至少一条用户输入数据的意图和实体,包括:
分别提取每条所述用户输入数据的意图和实体,并由每条所述用户输入数据的意图和实体形成特征数据;
所述将所述意图和实体输入至对话处理模型中处理,包括:
将所述特征数据输入至对话处理模型中处理。


3.根据权利要求2所述的方法,其特征在于,所述由每条所述用户输入数据的意图和实体形成特征数据,包括:
基于每条所述用户输入数据的意图和实体形成一特征向量,并由每条所述用户输入数据对应得到的特征向量组成所述特征数据;
其中,所述特征向量为独热one-hot向量。


4.根据权利要求1所述的方法,其特征在于,在所述将所述意图和实体输入至对话处理模型中处理,得到与所述用户输入数据匹配的回复数据之前,所述方法还包括:
若所述用户输入数据中的当前用户输入数据为用户首次输入的数据,则识别出所述用户输入数据的意图,并从若干个针对不同场景的对话处理模型中选择出与所述意图匹配的对话处理模型,以作为对所述用户输入数据进行处理的对话处理模型;
若所述用户输入数据中的当前用户输入数据不为用户首次输入的数据,则选择对用户前次输入的用户输入数据进行回复时所采用的对话处理模型,以作为对所述用户输入数据进行处理的对话处理模型。


5.根据权利要求1所述的方法,其特征在于,所述将所述意图和实体输入至对话处理模型中处理,得到与所述用户输入数据匹配的回复数据,包括:
将所述意图和实体输入至对话处理模型中处理,得到至少一条预测回复数据及所述预测回复数据的匹配评估结果;
选择所述匹配评估结果符合预设要求的所述预测回复数据作为与所述用户输入数据匹配的回复数据。


6.根据权利要求5所述的方法,其特征在于,所述将所述意图和实体输入至对话处理模型中处理,得到与所述用户输入数据匹配的回复数据,还包括:
若所述至少一条预测回复数据均不符合所述预设要求,则保存所述对话处理模型的处理记录,并从若干个针对不同场景的对话处理模型中,重新选择与所述用户输入数据的意图匹配的其他对话处理模型,并将所述意图和实体输入至所述重新选...

【专利技术属性】
技术研发人员:黄磊靳丁南罗欢权圣
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1