对话交互方法、装置及电子设备制造方法及图纸

技术编号:22755050 阅读:19 留言:0更新日期:2019-12-07 03:57
本发明专利技术提供了一种对话交互方法、装置及电子设备,涉及人工智能技术领域,该方法包括:获取对话操作对应的候选回答集;其中,候选回答集中的候选回答包括至少一个检索回答和/或至少一个生成回答;将对话操作对应的对话问题和候选回答集输入至预先训练得到的排序模型;其中,排序模型为基于对话语料样本训练得到的;通过排序模型计算对话问题与候选回答集中的每个候选回答的匹配度;基于每个候选回答的匹配度生成候选回答的排序结果;按照排序结果回复对话操作。本发明专利技术能够有效改善人机对话效果,提升用户满意度。

Dialogue and interaction methods, devices and electronic equipment

The invention provides a dialogue interaction method, device and electronic device, relating to the field of artificial intelligence technology, the method includes: obtaining a candidate answer set corresponding to a dialogue operation; wherein, the candidate answer in the candidate answer set includes at least one retrieval answer and / or at least one generation answer; inputting the dialogue question and candidate answer set corresponding to a dialogue operation into a pre-trained The sorting model of to is based on the training of dialogue corpus samples; the matching degree of dialogue questions and each candidate answer in the candidate answer set is calculated by the sorting model; the sorting result of candidate answers is generated based on the matching degree of each candidate answer; the dialogue operation is replied according to the sorting result. The invention can effectively improve the man-machine dialogue effect and enhance the user satisfaction.

【技术实现步骤摘要】
对话交互方法、装置及电子设备
本专利技术涉及人工智能
,尤其是涉及一种对话交互方法、装置及电子设备。
技术介绍
人机自动对话是人工智能领域的重要应用,目前多采用自然语言处理技术实现自动对话。在人机对话技术中,通常是首先设置多个匹配子模型,不同子模型用于计算不同方式产生的候选回答与用户问题之间的匹配度;然后将多个子模型的匹配度和预设的与回答有关的人工特征输入至基于GBDT(GradientBoostingDecisionTree,梯度提升决策树)或Xgboost的树模型,通过树模型输出各候选回答的得分;最后根据得分对候选回答进行排序,挑选出得分最高的回答返回给用户。但是,专利技术人经研究发现,在上述方式中,由于不同子模型计算匹配度的过程并不统一,子模型之间的差异性导致候选回答的排序结果不准确,致使给用户的回答难以让用户满意;同时,多个子模型的资源消耗过大且部署繁琐,导致回答的排序结果的生成效率较低,无法及时响应用户,综合导致人机对话效果不佳,用户体验较差。
技术实现思路
本专利技术的目的在于提供一种对话交互方法、装置及电子设备,能够有效改善人机对话效果,提升用户满意度。本专利技术提供一种对话交互方法,该方法包括:获取对话操作对应的候选回答集;其中,候选回答集中的候选回答包括至少一个检索回答和/或至少一个生成回答;将对话操作对应的对话问题和候选回答集输入至预先训练得到的排序模型;其中,排序模型为基于对话语料样本训练得到的;通过排序模型计算对话问题与候选回答集中的每个候选回答的匹配度;基于每个候选回答的匹配度生成候选回答的排序结果;按照排序结果回复对话操作。进一步的,基于每个候选回答的匹配度生成候选回答的排序结果的步骤,包括:根据候选回答的匹配度大小对每个候选回答进行排序,得到初始排序结果;根据预设的处理规则对初始排序结果进行顺序调整,得到候选回答的最终排序结果;其中,预设的处理规则包括以下中的一种或多种:候选回答的来源优先级、候选回答的长度、候选回答与对话问题的重复度、候选回答的来源占比、候选回答中包含的词语序列的联合概率。进一步的,当预设的处理规则包括候选回答的来源优先级时,根据预设的处理规则对初始排序结果进行顺序调整的步骤,包括:如果候选回答集中包括多个候选回答,获取每个候选回答携带的来源标识;其中,来源标识包括网络对话检索库标识、人工对话检索库标识和生成式回答标识中的一种或多种;根据候选回答的来源优先级对每个候选回答携带的来源标识进行排序;按照来源标识的排序结果对初始排序结果进行顺序调整。进一步的,将对话操作对应的对话问题和候选回答集输入至预先训练得到的排序模型的步骤,包括:如果对话问题包括待答复问题和待答复问题之前的背景对话,采用预设拼接符号将背景对话和待答复问题分别与各个候选回答进行拼接,得到拼接对话;将拼接对话输入至预先训练得到的排序模型。进一步的,通过排序模型计算对话问题和候选回答的匹配度的步骤,包括:根据拼接对话中的字符生成矩阵;其中,矩阵中的元素为字符对应的字向量;通过排序模型对矩阵进行运算,得到对话问题和候选回答的匹配度。进一步的,按照排序结果回复对话操作的步骤,包括:将排在首位的候选回答作为目标回答;以目标回答对应的文字和/或语音回复对话操作。进一步的,排序模型的训练过程包括:采集对话语料样本;其中,对话语料样本包括单轮对话语料和多轮对话语料;将多轮对话语料拆解为多个子对话语料;子对话语料中包含至少一轮上下文对话;基于轮对话语料和子对话语料得到正样本对话语料和负样本对话语料;利用正样本对话语料和负样本对话语料训练二分类模型,得到排序模型。进一步的,采集对话语料样本的步骤,包括:通过网络爬虫获取网络对话;对网络对话进行数据清洗和数据质量标注,得到对话语料样本。进一步的,将多轮对话语料拆解为多个子对话语料的步骤,包括:将多轮对话语料中首轮对话的回答作为起始拆解节点,对多轮对话语料中位于起始拆解节点之后的对话进行拆解,得到多个拆解节点;对于每个拆解节点,均将该拆解节点与该拆解节点之前的对话确定为子对话语料;子对话语料的数量与拆解节点的数量相等。进一步的,基于轮对话语料和子对话语料得到正样本对话语料和负样本对话语料的步骤,包括:对单轮对话语料和子对话语料进行采样,得到正样本对话语料;在单轮对话语料和子对话语料中任意选取一句结尾回答;采用任意选取的结尾回答替换正样本对话语料中的原始回答,得到负样本对话语料。进一步的,上述对话交互方法应用于配置有交互式用户接口的聊天机器人,交互式用户接口包括:聊天操作界面和/或语音采集器。本专利技术提供一种对话交互装置,该装置包括:回答获取模块,用于获取对话操作对应的候选回答集;其中,候选回答集中的候选回答包括至少一个检索回答和/或至少一个生成回答;模型输入模块,用于将对话操作对应的对话问题和候选回答集输入至预先训练得到的排序模型;其中,排序模型为基于对话语料样本训练得到的;匹配度计算模块,用于通过排序模型计算对话问题与候选回答集中的每个候选回答的匹配度;排序模块,用于基于每个候选回答的匹配度生成候选回答的排序结果;回复模块,用于按照排序结果回复对话操作。本专利技术提供一种电子设备,其中,包括:处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被处理器运行时执行如上任一项所述的方法。本专利技术提供一种计算机可读存储介质,其中,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行如上任一项所述方法的步骤。本专利技术实施例提供的上述对话交互方法、装置及电子设备,能够获取对话操作对应的候选回答集;将对话操作对应的对话问题和候选回答集输入至预先训练得到的排序模型;通过排序模型计算对话问题与候选回答集中的每个候选回答的匹配度;基于每个候选回答的匹配度生成候选回答的排序结果;按照排序结果回复对话操作。相对于现有通过多个子模型分别计算问题与每个回答的匹配度的方式,本实施例上述这种将对话操作对应的候选回答集统一输入排序模型,并通过排序模型直接计算对话问题与每个候选回答的匹配度的方式,不但可以简化模型的部署,有效提升了排序结果的生成效率,还可以避免现有技术中存在的对话问题与各候选回答在计算匹配度过程中存在的差异性,也即提高了匹配度计算过程的一致性,从而有效提高了回答排序结果的准确性。综上,本实施例提供的人机交互方法能够较为及时准确地响应用户,较好地改善了人机对话效果,提升了用户满意度。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的对话交互方法流程图;图2为本专利技术实施例提供的排序模型训练方法流程图;图3为本专利技术实施例提供的排序模型对候选答案进行排序的示意图;图4为本专利技术实施例提供的对话本文档来自技高网...

【技术保护点】
1.一种对话交互方法,其特征在于,所述方法包括:/n获取对话操作对应的候选回答集;其中,所述候选回答集中的候选回答包括至少一个检索回答和/或至少一个生成回答;/n将所述对话操作对应的对话问题和所述候选回答集输入至预先训练得到的排序模型;其中,所述排序模型为基于对话语料样本训练得到的;/n通过所述排序模型计算所述对话问题与所述候选回答集中的每个所述候选回答的匹配度;/n基于每个所述候选回答的匹配度生成所述候选回答的排序结果;/n按照所述排序结果回复所述对话操作。/n

【技术特征摘要】
1.一种对话交互方法,其特征在于,所述方法包括:
获取对话操作对应的候选回答集;其中,所述候选回答集中的候选回答包括至少一个检索回答和/或至少一个生成回答;
将所述对话操作对应的对话问题和所述候选回答集输入至预先训练得到的排序模型;其中,所述排序模型为基于对话语料样本训练得到的;
通过所述排序模型计算所述对话问题与所述候选回答集中的每个所述候选回答的匹配度;
基于每个所述候选回答的匹配度生成所述候选回答的排序结果;
按照所述排序结果回复所述对话操作。


2.根据权利要求1所述的方法,其特征在于,基于每个所述候选回答的匹配度生成所述候选回答的排序结果的步骤,包括:
根据所述候选回答的匹配度大小对每个所述候选回答进行排序,得到初始排序结果;
根据预设的处理规则对所述初始排序结果进行顺序调整,得到所述候选回答的最终排序结果;其中,所述预设的处理规则包括以下中的一种或多种:候选回答的来源优先级、候选回答的长度、候选回答与对话问题的重复度、候选回答的来源占比、候选回答中包含的词语序列的联合概率。


3.根据权利要求2所述的方法,其特征在于,当所述预设的处理规则包括所述候选回答的来源优先级时,所述根据预设的处理规则对所述初始排序结果进行顺序调整的步骤,包括:
如果所述候选回答集中包括多个候选回答,获取每个所述候选回答携带的来源标识;其中,所述来源标识包括网络对话检索库标识、人工对话检索库标识和生成式回答标识中的一种或多种;
根据所述候选回答的来源优先级对每个所述候选回答携带的来源标识进行排序;
按照所述来源标识的排序结果对所述初始排序结果进行顺序调整。


4.根据权利要求1所述的方法,其特征在于,将所述对话操作对应的对话问题和所述候选回答集输入至预先训练得到的排序模型的步骤,包括:
如果所述对话问题包括待答复问题和所述待答复问题之前的背景对话,采用预设拼接符号将所述背景对话和所述待答复问题分别与各个所述候选回答进行拼接,得到拼接对话;
将所述拼接对话输入至预先训练得到的排序模型。


5.根据权利要求4所述的方法,其特征在于,通过所述排序模型计算所述对话问题和所述候选回答的匹配度的步骤,包括:
根据所述拼接对话中的字符生成矩阵;其中,所述矩阵中的元素为所述字符对应的字向量;
通过所述排序模型对所述矩阵进行运算,得到所述对话问题和所述候选回答的匹配度。


6.根据权利要求1所述的方法,其特征在于,按照所述排序结果回复所述对话操作的步骤,包括:
将排在首位的候选回答作为目标回答;
以所述目标回答对应的文字和/或语音回复所述对话操作。


7.根据权利要求1所述的方法,其特征在于,所述排序模型的训练过程包括:<...

【专利技术属性】
技术研发人员:邵建智毛晓曦范长杰
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1