意图识别模型的训练方法、意图识别方法、装置及介质制造方法及图纸

技术编号：38156744 阅读：25 留言：0更新日期：2023-07-13 09:25

本申请公开一种意图识别模型的训练方法、意图识别方法、装置及介质，该方法包括：获取包括第一问题信息与第一回复信息的第一原始数据；将第一原始数据输入意图识别模型中的生成模型，生成包含有多个第一预测回复信息的生成结果；将第一问题信息与生成结果中的每个第一预测回复信息输入意图识别模型中的意图分类模型，生成候选意图集；基于第一原始数据、候选意图集与第一意图标签，确定第一训练数据；基于第一训练数据训练意图识别模型，得到训练好的意图识别模型，使用训练好的意图识别模型确定用户意图时，无需等待用户说话完毕，而是可以基于语音转写的中间转写结果进行语义补全并预测用户意图，在预测到用户的明确意图时提前进行后续流程。前进行后续流程。前进行后续流程。

全部详细技术资料下载

【技术实现步骤摘要】
意图识别模型的训练方法、意图识别方法、装置及介质

[0001]本申请涉及计算机
，具体涉及一种意图识别模型的训练方法、意图识别方法、装置及介质。

技术介绍

[0002]外呼机器人是一种任务型对话系统，指的是机器给人打电话的系统(反之，人给机器打电话的系统称为呼入机器人)，该系统的目标是完成预设的特定任务(例如确定家中是否有人收快递，是否愿意参加某项营销活动等)，对话过程中，机器人会引导对话的有效进行，在实际应用场景中应用广泛。
[0003]在当前企业追求经营降本增效和精益用户运营的强烈需求驱动下，外呼机器人作为人工智能(Artificial Intelligence，AI)技术成熟的产业落地应用，受到越来越高的关注与普及。它能帮助企业和组织精准高效地触达用户，通过优质的人机交互，实现服务提升、营销转化等后续增长目标。但随着外呼机器人在日常生活、工作中被越来越频繁的使用，用户对于拟真度的要求也越来越高，一旦出现答非所问、反应慢等问题，极有可能直接挂断电话，影响转化率等业务指标。
[0004]目前，用于外呼机器人拨打电话过程中，在进行用户意图识别时，通常是等待用户说话完毕后，基于用户的完整说话内容对应的语音识别结果进行意图识别，人机语音交互的响应时间较长，人机交互效率低。

技术实现思路

[0005]本申请实施例提供一种意图识别模型的训练方法、意图识别方法、装置及介质，可以在用户尚未完成回答时，基于语音转写的中间转写结果进行语义补全并对用户的意图进行预测，能够在预测到用户的明确意图时提...

【技术保护点】

【技术特征摘要】
1.一种意图识别模型的训练方法，其特征在于，所述意图识别模型包括生成模型与意图分类模型，所述方法包括：获取第一原始数据，所述第一原始数据包括第一问题信息与所述第一问题信息对应的第一回复信息；将所述第一原始数据输入所述生成模型进行回复信息预测，以生成包含有多个第一预测回复信息的生成结果；将所述第一问题信息与所述生成结果中的每个所述第一预测回复信息输入所述意图分类模型进行意图预测，以生成候选意图集；基于所述第一原始数据、所述候选意图集与第一意图标签，确定第一训练数据；基于所述第一训练数据对所述意图识别模型进行训练，得到训练好的意图识别模型，其中，在对所述意图识别模型进行训练时，第一训练目标为所述意图识别模型输出的第一预测意图信息符合所述第一意图标签。2.如权利要求1所述的意图识别模型的训练方法，其特征在于，所述将所述第一原始数据输入所述生成模型进行回复信息预测，以生成包含有多个第一预测回复信息的生成结果，包括：根据所述第一原始数据生成第一模型输入信息，所述第一模型输入信息包括所述第一问题信息、所述第一回复信息对应的第一截断回复信息和第一掩码信息；对所述第一模型输入信息进行自注意力编码，得到所述第一模型输入信息对应的第一模型编码向量；将所述第一截断回复信息的最后n个字符与所述第一掩码信息的所有字符作为第一目标提取位置，从所述第一模型编码向量中提取所述第一目标提取位置对应的编码向量，得到第二模型编码向量，n为正整数；对所述第二模型编码向量进行解码，得到第一解码向量；对所述第一解码向量进行第一处理，得到第一字符概率矩阵，所述第一字符概率矩阵表征所述第一目标提取位置中每个位置对应不同字符的概率；对所述第一解码向量进行第二处理，得到第一转移概率矩阵，所述第一转移概率矩阵表征所述第一目标提取位置中每个位置到其他位置的跳转概率；基于所述第一字符概率矩阵和所述第一转移概率矩阵，计算不同的第一候选文本对应的第一文本概率，将所述第一文本概率按照从大到小进行排序，并将排在前m个的第一文本概率对应的第一候选文本作为所述生成结果中的多个第一预测回复信息，m为正整数。3.如权利要求1所述的意图识别模型的训练方法，其特征在于，所述基于所述第一训练数据对所述意图识别模型进行训练，得到训练好的意图识别模型，包括：采用所述意图分类模型对所述第一训练数据中的所述候选意图集的每个候选意图信息的文本进行编码，得到第一意图文本编码；根据所述第一训练数据中的所述第一原始数据生成第一模型输入信息，并采用所述生成模型对所述第一模型输入信息进行自注意力编码，得到所述第一模型输入信息对应的第一模型编码向量；基于所述第一意图文本编码与所述第一模型编码向量计算注意力权重，得到第一意图注意力编码；
对所述第一意图注意力编码进行线性变换处理与归一化处理，得到所述候选意图集的每个候选意图信息对应的第一意图概率；根据所述第一意图概率确定所述第一预测意图信息；根据所述第一预测概率信息与所述第一意图标签，对基于所述第一训练目标构建的损失函数对所述意图识别模型进行训练，以得到所述训练好的意图识别模型。4.一种意图识别方法，其特征在于，所述方法包括：获取待处理数据，所述待处理数据包括目标问题信息与所述目标问题信息对应的实时回复信息，所述目标问题信息为外呼机器人播报的问题信息，所述实时回复信息包括对象针对所述目标问题信息未回复完毕的不完整回复信息；基于训练好的意图识别模型对所述待处理数据进行意图识别，得到所述待处理数据对应的目标意图信息，其中，所述训练好的意图识别模型是根据权利要求1
‑
3中任一项所述...

【专利技术属性】
技术研发人员：田垠，冯旻伟，尹竞成，阮良，
申请(专利权)人：杭州网易智企科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人