意图识别模型的训练方法、意图识别方法、装置及介质制造方法及图纸

技术编号:38156744 阅读:12 留言:0更新日期:2023-07-13 09:25
本申请公开一种意图识别模型的训练方法、意图识别方法、装置及介质,该方法包括:获取包括第一问题信息与第一回复信息的第一原始数据;将第一原始数据输入意图识别模型中的生成模型,生成包含有多个第一预测回复信息的生成结果;将第一问题信息与生成结果中的每个第一预测回复信息输入意图识别模型中的意图分类模型,生成候选意图集;基于第一原始数据、候选意图集与第一意图标签,确定第一训练数据;基于第一训练数据训练意图识别模型,得到训练好的意图识别模型,使用训练好的意图识别模型确定用户意图时,无需等待用户说话完毕,而是可以基于语音转写的中间转写结果进行语义补全并预测用户意图,在预测到用户的明确意图时提前进行后续流程。前进行后续流程。前进行后续流程。

【技术实现步骤摘要】
意图识别模型的训练方法、意图识别方法、装置及介质


[0001]本申请涉及计算机
,具体涉及一种意图识别模型的训练方法、意图识别方法、装置及介质。

技术介绍

[0002]外呼机器人是一种任务型对话系统,指的是机器给人打电话的系统(反之,人给机器打电话的系统称为呼入机器人),该系统的目标是完成预设的特定任务(例如确定家中是否有人收快递,是否愿意参加某项营销活动等),对话过程中,机器人会引导对话的有效进行,在实际应用场景中应用广泛。
[0003]在当前企业追求经营降本增效和精益用户运营的强烈需求驱动下,外呼机器人作为人工智能(Artificial Intelligence,AI)技术成熟的产业落地应用,受到越来越高的关注与普及。它能帮助企业和组织精准高效地触达用户,通过优质的人机交互,实现服务提升、营销转化等后续增长目标。但随着外呼机器人在日常生活、工作中被越来越频繁的使用,用户对于拟真度的要求也越来越高,一旦出现答非所问、反应慢等问题,极有可能直接挂断电话,影响转化率等业务指标。
[0004]目前,用于外呼机器人拨打电话过程中,在进行用户意图识别时,通常是等待用户说话完毕后,基于用户的完整说话内容对应的语音识别结果进行意图识别,人机语音交互的响应时间较长,人机交互效率低。

技术实现思路

[0005]本申请实施例提供一种意图识别模型的训练方法、意图识别方法、装置及介质,可以在用户尚未完成回答时,基于语音转写的中间转写结果进行语义补全并对用户的意图进行预测,能够在预测到用户的明确意图时提前进行后续流程的处理,降低整体响应时长,更快地回应用户,提升人机交互效率,提升通话体验。
[0006]一方面,本申请实施例提供一种意图识别模型的训练方法,所述意图识别模型包括生成模型与意图分类模型,所述方法包括:
[0007]获取第一原始数据,所述第一原始数据包括第一问题信息与所述第一问题信息对应的第一回复信息;
[0008]将所述第一原始数据输入所述生成模型进行回复信息预测,以生成包含有多个第一预测回复信息的生成结果;
[0009]将所述第一问题信息与所述生成结果中的每个所述第一预测回复信息输入所述意图分类模型进行意图预测,以生成候选意图集;
[0010]基于所述第一原始数据、所述候选意图集与第一意图标签,确定第一训练数据;
[0011]基于所述第一训练数据对所述意图识别模型进行训练,得到训练好的意图识别模型,其中,在对所述意图识别模型进行训练时,第一训练目标为所述意图识别模型输出的第一预测意图信息符合所述第一意图标签。
[0012]另一方面,本申请实施例提供一种意图识别方法,所述方法包括:
[0013]获取待处理数据,所述待处理数据包括目标问题信息与所述目标问题信息对应的实时回复信息,所述目标问题信息为外呼机器人播报的问题信息,所述实时回复信息包括对象针对所述目标问题信息未回复完毕的不完整回复信息;
[0014]基于训练好的意图识别模型对所述待处理数据进行意图识别,得到所述待处理数据对应的目标意图信息,其中,所述训练好的意图识别模型是根据如上任一实施例所述的意图识别模型的训练方法进行训练得到的。
[0015]另一方面,本申请实施例提供一种意图识别模型的训练装置,所述意图识别模型包括生成模型与意图分类模型,所述装置包括:
[0016]第一获取单元,用于获取第一原始数据,所述第一原始数据包括第一问题信息与所述第一问题信息对应的第一回复信息;
[0017]第一处理单元,用于将所述第一原始数据输入所述生成模型进行回复信息预测,以生成包含有多个第一预测回复信息的生成结果;
[0018]第二处理单元,用于将所述第一问题信息与所述生成结果中的每个所述第一预测回复信息输入所述意图分类模型进行意图预测,以生成候选意图集;
[0019]确定单元,用于基于所述第一原始数据、所述候选意图集与第一意图标签,确定第一训练数据;
[0020]训练单元,用于基于所述第一训练数据对所述意图识别模型进行训练,得到训练好的意图识别模型,其中,在对所述意图识别模型进行训练时,第一训练目标为所述意图识别模型输出的第一预测意图信息符合所述第一意图标签。
[0021]另一方面,本申请实施例提供一种意图识别装置,所述装置包括:
[0022]第二获取单元,用于获取待处理数据,所述待处理数据包括目标问题信息与所述目标问题信息对应的实时回复信息,所述目标问题信息为外呼机器人播报的问题信息,所述实时回复信息包括对象针对所述目标问题信息未回复完毕的不完整回复信息;
[0023]识别单元,用于基于训练好的意图识别模型对所述待处理数据进行意图识别,得到所述待处理数据对应的目标意图信息,其中,所述训练好的意图识别模型是根据如上任一实施例所述的意图识别模型的训练方法进行训练得到的。
[0024]另一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上任一实施例所述的方法。
[0025]另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行如上任一实施例所述的意图识别模型的训练方法。
[0026]另一方面,本申请实施例提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如上任一实施例所述的方法。
[0027]本申请实施例中,意图识别模型包括生成模型与意图分类模型,通过获取第一原始数据,第一原始数据包括第一问题信息与第一问题信息对应的第一回复信息;将第一原始数据输入生成模型进行回复信息预测,以生成包含有多个第一预测回复信息的生成结果;将第一问题信息与生成结果中的每个第一预测回复信息输入意图分类模型进行意图预
测,以生成候选意图集;基于第一原始数据、候选意图集与第一意图标签,确定第一训练数据;基于第一训练数据对意图识别模型进行训练,得到训练好的意图识别模型,其中,在对意图识别模型进行训练时,第一训练目标为意图识别模型输出的第一预测意图信息符合第一意图标签。
[0028]本申请实施例可以利用生成模型对第一原始数据对应的不完整回复信息进行语义补全生成包含有多个第一预测回复信息的生成结果,然后采用意图分类模型针对每个第一预测回复信息进行意图预测以生成候选意图集,并基于第一原始数据、候选意图集与第一意图标签,确定第一训练数据,然后基于第一训练数据对意图识别模型进行训练,得到训练好的意图识别模型。使用该训练好的意图识别模型确定用户的意图时,无需等待用户说话完毕,而是可以在用户尚未完成回答时,基于采集的待处理数据的语音转写的中间转写结果进行语义补全并对用户的意图进行预测,换言之,本申请实施例能够在预测到用户的明确意图时提前进行后续流程的处理。相比于等待用户说话完毕再进行意图确认的情况,本申请实施例可以将确定意图的时间提前本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别模型的训练方法,其特征在于,所述意图识别模型包括生成模型与意图分类模型,所述方法包括:获取第一原始数据,所述第一原始数据包括第一问题信息与所述第一问题信息对应的第一回复信息;将所述第一原始数据输入所述生成模型进行回复信息预测,以生成包含有多个第一预测回复信息的生成结果;将所述第一问题信息与所述生成结果中的每个所述第一预测回复信息输入所述意图分类模型进行意图预测,以生成候选意图集;基于所述第一原始数据、所述候选意图集与第一意图标签,确定第一训练数据;基于所述第一训练数据对所述意图识别模型进行训练,得到训练好的意图识别模型,其中,在对所述意图识别模型进行训练时,第一训练目标为所述意图识别模型输出的第一预测意图信息符合所述第一意图标签。2.如权利要求1所述的意图识别模型的训练方法,其特征在于,所述将所述第一原始数据输入所述生成模型进行回复信息预测,以生成包含有多个第一预测回复信息的生成结果,包括:根据所述第一原始数据生成第一模型输入信息,所述第一模型输入信息包括所述第一问题信息、所述第一回复信息对应的第一截断回复信息和第一掩码信息;对所述第一模型输入信息进行自注意力编码,得到所述第一模型输入信息对应的第一模型编码向量;将所述第一截断回复信息的最后n个字符与所述第一掩码信息的所有字符作为第一目标提取位置,从所述第一模型编码向量中提取所述第一目标提取位置对应的编码向量,得到第二模型编码向量,n为正整数;对所述第二模型编码向量进行解码,得到第一解码向量;对所述第一解码向量进行第一处理,得到第一字符概率矩阵,所述第一字符概率矩阵表征所述第一目标提取位置中每个位置对应不同字符的概率;对所述第一解码向量进行第二处理,得到第一转移概率矩阵,所述第一转移概率矩阵表征所述第一目标提取位置中每个位置到其他位置的跳转概率;基于所述第一字符概率矩阵和所述第一转移概率矩阵,计算不同的第一候选文本对应的第一文本概率,将所述第一文本概率按照从大到小进行排序,并将排在前m个的第一文本概率对应的第一候选文本作为所述生成结果中的多个第一预测回复信息,m为正整数。3.如权利要求1所述的意图识别模型的训练方法,其特征在于,所述基于所述第一训练数据对所述意图识别模型进行训练,得到训练好的意图识别模型,包括:采用所述意图分类模型对所述第一训练数据中的所述候选意图集的每个候选意图信息的文本进行编码,得到第一意图文本编码;根据所述第一训练数据中的所述第一原始数据生成第一模型输入信息,并采用所述生成模型对所述第一模型输入信息进行自注意力编码,得到所述第一模型输入信息对应的第一模型编码向量;基于所述第一意图文本编码与所述第一模型编码向量计算注意力权重,得到第一意图注意力编码;
对所述第一意图注意力编码进行线性变换处理与归一化处理,得到所述候选意图集的每个候选意图信息对应的第一意图概率;根据所述第一意图概率确定所述第一预测意图信息;根据所述第一预测概率信息与所述第一意图标签,对基于所述第一训练目标构建的损失函数对所述意图识别模型进行训练,以得到所述训练好的意图识别模型。4.一种意图识别方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据包括目标问题信息与所述目标问题信息对应的实时回复信息,所述目标问题信息为外呼机器人播报的问题信息,所述实时回复信息包括对象针对所述目标问题信息未回复完毕的不完整回复信息;基于训练好的意图识别模型对所述待处理数据进行意图识别,得到所述待处理数据对应的目标意图信息,其中,所述训练好的意图识别模型是根据权利要求1

3中任一项所述...

【专利技术属性】
技术研发人员:田垠冯旻伟尹竞成阮良
申请(专利权)人:杭州网易智企科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1