【技术实现步骤摘要】
意图识别方法及装置、意图识别模型的训练方法及装置
[0001]本申请涉及计算机
,具体涉及一种意图识别方法及装置、意图识别模型的训练方法及装置。
技术介绍
[0002]意图识别是客服机器人系统的关键环节,一个意图识别准确的机器人能有效辅助业务,是业务自动化的核心。一般的客服机器人总是有固定的业务场景,例如,机票相关业务场景,或者贷款相关业务场景等等。当客户的提问在客服机器人所属的业务场景之外时,可以通过在神经网络模型中添加其他业务场景的意图分类任务,以将这些提问确定为其他业务场景的意图分类。然而,相对于客服机器人所属的业务场景的意图分类,其他业务场景的意图分类的数量相当庞大,且每个其他业务场景的意图分类下的训练数据也很难获得,因此,神经网络模型无法学习到所有的其他业务场景的意图分类,从而使得客服机器人无法准确地判断客户的提问所属的实际意图分类,进而降低了意图识别的准确率。
技术实现思路
[0003]有鉴于此,本申请的实施例致力于提供一种意图识别方法及装置、意图识别模型的训练方法及装置,能够准确地确定待识 ...
【技术保护点】
【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:根据待识别语音文本获取第一文本特征向量,根据所述第一文本特征向量获取所述待识别语音文本的初步意图分类,其中,所述初步意图分类为预设业务场景的意图分类;根据所述初步意图分类获取意图确定文本集,根据所述意图确定文本集获取第二文本特征向量集,其中,所述意图确定文本集为所述初步意图分类对应的文本集;确定所述第一文本特征向量与所述第二文本特征向量集之间的文本距离结果;基于所述文本距离结果,确定所述待识别语音文本的实际意图分类,其中,所述实际意图分类为所述初步意图分类或者除所述预设业务场景以外的其他业务场景的意图分类。2.根据权利要求1所述的方法,其特征在于,所述第二文本特征向量集包括至少两个第二文本特征向量,所述确定所述第一文本特征向量与所述第二文本特征向量集之间的文本距离结果,包括:将所述第一文本特征向量与每个第二文本特征向量输入意图识别模型进行语义相似度计算,得到所述第一文本特征向量与每个第二文本特征向量之间的文本距离;利用所述意图识别模型的激活函数,对所述文本距离进行函数运算,得到所述文本距离对应的概率值作为所述文本距离结果。3.根据权利要求2所述的方法,其特征在于,所述意图识别模型包括至少一个意图分类器,每个意图分类器对应所述预设业务场景的一个意图分类,其中,所述将所述第一文本特征向量与每个第二文本特征向量输入意图识别模型进行语义相似度计算,得到所述第一文本特征向量与每个第二文本特征向量之间的文本距离,包括:将所述第一文本特征向量与每个第二文本特征向量输入所述初步意图分类对应的意图分类器中进行语义相似度计算,得到所述第一文本特征向量与每个第二文本特征向量之间的文本距离。4.根据权利要求3所述的方法,其特征在于,每个意图分类器设置有拒绝半径参数,所述拒绝半径参数用于区分所述待识别语音文本的意图分类,其中,在所述文本距离包括欧氏距离的情况下,所述利用所述意图识别模型的激活函数,对所述文本距离进行函数运算,得到所述文本距离对应的概率值作为所述文本距离结果,包括:利用所述意图识别模型的激活函数对所述欧氏距离和所述初步意图分类对应的意图分类器的拒绝半径参数进行函数运算,得到所述文本距离对应的概率值作为所述文本距离结果。5.根据权利要求1所述的方法,其特征在于,所述第二文本特征向量集包括至少两个第二文本特征向量,所述文本距离结果包括与所述至少两个第二文本特征向量分别对应的至少两个概率值,其中,所述基于所述文本距离结果,确定所述待识别语音文本的实际意图分类,包括:若所述至少两个概率值中存在第一预设数量的大于或等于预设阈值的概率值,则确定所述待识别语音文本的实际意图分类为所述初步意图分类;若所述至少两个概率值中存在第二预设数量的小于所述预设阈值的概率值,则确定所述待识别语音文本的实际意图分类为所述其他业务场景的意图分类。6...
【专利技术属性】
技术研发人员:丁隆耀,蒋宁,肖冰,李宽,吕乐宾,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。