意图识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:36082885 阅读:17 留言:0更新日期:2022-12-24 10:57
本申请涉及人工智能以及数字医疗领域,公开了一种意图识别方法、装置、电子设备及可读存储介质,其方法包括:获取待识别文本;基于特征提取网络层,对待识别文本进行特征提取,得到语义特征向量;基于各全连接网络层,确定语义特征向量是否属于多个意图分类中的任意一个;若是,则将语义特征向量所属的意图分类,作为待识别文本的意图识别结果;若否,则拒识待识别文本。本申请提供的方法利用多个全连接网络层分别对语义特征向量进行处理,每个全连接网络层对应一个意图分类,故可以确定该语义特征向量是否属于任意一个意图分类;本申请基于现有拒识语料,将多分类问题转换成对于每个意图的二分类问题,使意图识别模型的拒识能力更强。强。强。

【技术实现步骤摘要】
意图识别方法、装置、电子设备及可读存储介质


[0001]本公开涉及人工智能以及数字医疗领域,具体而言,涉及一种意图识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着科技的不断发展,智能语音客服系统已经广泛应用在各个领域,包括金融领域、电商领域、通信领域、医疗领域等。智能语音客服能够识别用户以语音形式提出的问题,在识别出用户意图之后,给出针对性的回答,并以语音形式与用户沟通,向用户提供信息咨询等相关服务。
[0003]在目前的智能语音客服系统中,通常会预设一个系统支持的意图列表,通过意图识别模型对用户意图进行识别。当用户的问题在该意图列表之外时,意图识别模型通常无法进行有效拒识,影响用户体验。一般的,可以通过增加拒识语料来提升意图识别模型的拒识能力。但是,在某些场景下,智能语音客服系统上线前,收集拒识语料存在困难,且拒识语料范围较广,无法收集较全面。

技术实现思路

[0004]针对上述情况,本申请实施例提供了一种意图识别方法、装置、电子设备及可读存储介质,以克服或部分克服
技术介绍
中存在的问题。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,所述意图识别方法基于意图识别模型实现,所述意图识别模型包括特征提取网络层和多个全连接网络层,其中,所述特征提取网络层分别连接各所述全连接网络层,每个所述全连接网络层对应一个意图分类;所述方法包括:获取待识别文本;基于所述特征提取网络层,对所述待识别文本进行特征提取,得到语义特征向量;基于各所述全连接网络层,确定所述语义特征向量是否属于所述多个意图分类中的任意一个;若是,则将所述语义特征向量所属的意图分类,作为所述待识别文本的意图识别结果;若否,则拒识所述待识别文本。2.根据权利要求1所述的方法,其特征在于,所述确定所述语义特征向量是否属于所述多个意图分类中的任意一个,包括:利用各所述全连接网络层,分别对所述语义特征向量进行处理,得到多个分类概率值;基于设置的分类概率阈值,对多个所述分类概率值进行分类处理,得到多个分类预测值;基于所述多个分类预测值,确定所述语义特征向量是否属于所述多个意图分类中的任意一个。3.根据权利要求2所述的方法,其特征在于,所述基于所述多个分类预测值,确定所述语义特征向量是否属于所述多个意图分类中的任意一个,包括:若一个所述全连接网络层输出的分类预测值为第一预设值,则确定所述语义特征向量不属于所述全连接网络层对应的意图分类;若一个所述全连接网络层输出的分类预测值为第二预设值,则确定所述语义特征向量属于所述全连接网络层对应的意图分类。4.根据权利要求1所述的方法,其特征在于,所述意图识别模型是根据下述方法训练得到的:获取训练样本集;其中,所述训练样本集包括多个样本组;各所述样本组包括多个正样本和多个负样本;所述多个样本组与所述各所述全连接网络层一一对应;获取意图识别初始模型,其中,所述意图识别初始模型的损失函数包括:交叉熵损失函数和对比学习损失函数;将所述训练样本集输入所述意图识别初始模型进行训练,得到意图识别模型。5.根据权利要求4所述的方法,其特征在于,所述将所述训练样本集输入所述意图识别初始模型进行训练,得到意图识别模型,包括:基于所述特征提取网络层,对各所述样本组中的多个正样本和多个负样本进行特征提取,得到各所述样本组对应的...

【专利技术属性】
技术研发人员:孙金辉李平马骏王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1