【技术实现步骤摘要】
意图识别模型训练方法、识别方法、装置、设备及介质
[0001]本专利技术涉及人工智能
,尤其涉及一种意图识别模型训练方法、识别方法、装置、设备及介质。
技术介绍
[0002]对话系统是自然语言处理中的一项非常具有挑战的任务,对话系统包括闲聊、问答和任务多种系统类型,能够在不同场景为客户提供不同的信息。在对话系统中,需要对客户的意图进行识别,以根据识别到的客户意图为用户提供服务,意图识别准确率影响对话系统的整体质量。
[0003]目前,意图识别方法主要采用机器学习的方法,训练获得意图识别模型,然后利用训练好的意图识别模型,对系统中客户输入文本的意图进行识别。但在实际应用中,对客户输入文本的意图识别可以细分为依次细化的多层级的意图识别任务,例如在催收场景对话下,需要依次识别客户本人
‑
咨询类
‑
账户信息
‑
还款时间等四个意图标签,下级意图标签是上级标签的细分标签,对具有不同层级的四个意图标签进行识别,能够准确识别客户输入的意图。
[0004]但现有的意图 ...
【技术保护点】
【技术特征摘要】
1.一种意图识别模型训练方法,其特征在于,包括:获取预设对话样本数据集,所述预设对话样本数据集中的对话样本对应一个意图标签链,所述意图标签链包括意图级别依次细化的多个标准意图标签;将所述对话样本输入含有初始参数的预设识别模型中,以通过所述预设识别模型对所述对话样本进行意图预测,得到意图级别依次细化的多个意图预测标签;根据所述多个意图预测标签和所述多个标准意图标签,确定所述预设识别模型的总损失值;在所述总损失值未达到预设收敛条件时,迭代更新所述预设识别模型的初始参数,直至所述总损失值达到所述预设收敛条件时,将收敛之后的所述预设识别模型记录为意图识别模型。2.如权利要求1所述的意图识别模型训练方法,其特征在于,所述将所述对话样本输入含有初始参数的预设识别模型中,以通过所述预设识别模型对所述对话样本进行意图预测,得到意图级别依次细化的多个意图预测标签,包括:将所述对话样本输入所述预设识别模型的输入层,以获得所述输入层输出的所述对话样本的上下文语义向量;将所述上下文语义向量输入所述预设识别模型的特征提取模块,以获得所述特征提取模块输出的多个拼接特征向量序列,所述多个拼接特征向量序列的特征向量依次增加;将所述拼接特征向量序列输入所述预设识别模型中对应的多层感知机,以使所述多层感知机对所述拼接特征向量序列进行意图预测;获取多个所述多层感知机输出的意图预测标签,作为所述多个意图预测标签。3.如权利要求2所述的意图识别模型训练方法,其特征在于,所述将所述上下文语义向量输入所述预设识别模型的特征提取模块,以获得所述特征提取模块输出的多个拼接特征向量序列,包括:将所述上下文语义向量输入所述特征提取模块,以获取所述特征提取模块中多个特征提取层对应输出的语义特征向量,所述特征提取模块由所述多个特征提取层依次堆叠形成,所述特征提取层输出的特征向量为下一特征提取层的输入;根据所述多个特征提取层的排列顺序,对所述多个特征提取层对应输出的语义特征向量进行划分组合,以获得所述多个拼接特征向量序列。4.如权利要求3所述的意图识别模型训练方法,其特征在于,所述将所述上下文语义向量输入所述特征提取模块,以使所述特征提取模块的多个特征提取层对应输出语义特征向量,包括:在所述对话样本的上下文语义向量中,确定坐席文本样本的第一语义向量和客户文本样本的第二语义向量;将所述第一语义向量和所述第二语义向量输入第一个特征提取层,以使所述第一个特征提取层对所述第一语义向量和所述第二语义向量进行特征提取,并对提取到的特征向量进行语义关系捕获,以获得所述第一个特征提取层输出的语义特征向量;将所述第一个特征提取层提取到的特征向量输入下一特征提取层,以使下一特征提取层对输入的特征向量进行特征提取,并对提取到的特征向量进行语义关系捕获,以获得下一特征提取层输出的语义特征向量;
依次遍历所有的特征提取层,以获得多个所述特征提取层对应输出的语义特征向量。5.如权利要求4所述的意图识别模型训练方...
【专利技术属性】
技术研发人员:胡超文,
申请(专利权)人:平安普惠企业管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。