【技术实现步骤摘要】
意图识别模型训练及语音意图识别方法、装置和相关设备
[0001]本申请涉及人工智能
,尤其涉及一种意图识别模型训练及语音意图识别方法、装置和相关设备。
技术介绍
[0002]不论是语音还是文字都蕴含着用户通过自然语言表达出的各种意图或需求。准确的挖掘用户意图能够为后续服务提供有效支撑。现有技术往往是通过对语音进行语音识别提取出文本内容,然后根据文本内容来挖掘用户意图,这种方式提取的信息单一不够全面,导致语音中的重要信息例如用户语气和停顿、韵律、节奏、音调等语音能额外表达出来的信息丢失或被过滤,进而不能准确地识别出用户意图。如何通过提供的语音或口语化的形式表达准确地挖掘用户的语义意图是亟需解决的问题。
技术实现思路
[0003]为了解决现有技术中从语音中提取的信息不全面且单一导致不能准确挖掘出用户意图的的技术问题。本申请提供了一种意图识别模型训练及语音意图识别方法、装置和相关设备,其主要目的在从语音中以多维度获取信息进行融合得到完整的用户意图。
[0004]为实现上述目的,本申请提供了一种意图识别 ...
【技术保护点】
【技术特征摘要】
1.一种意图识别模型的训练方法,其特征在于,所述方法包括:获取数据集,其中,所述数据集所包含的每条样本语音标注有对应的用户意图标签;对所述样本语音进行语音识别,得到所述样本语音的样本识别文本对应的样本文本特征;提取所述样本语音对应的样本语音特征;将所述样本文本特征和样本语音特征输入至待训练的意图识别模型,通过所述待训练的意图识别模型得到至少两个意图隐变量,对所有意图隐变量进行融合得到融合意图特征表示,根据所述融合意图特征表示进行意图预测,得到预测意图标签;计算整体损失函数,根据所述整体损失函数计算得到的梯度更新模型参数,直至模型收敛,得到已训练的意图识别模型,其中,所述整体损失函数包括分类损失函数,所述分类损失函数是根据所述预测意图标签和对应的用户意图标签计算得到的。2.根据权利要求1所述的方法,其特征在于,所述将所述样本文本特征和样本语音特征输入至待训练的意图识别模型,通过所述待训练的意图识别模型得到至少两个意图隐变量,对所有意图隐变量进行融合得到融合意图特征表示,根据所述融合意图特征表示进行意图预测,得到预测意图标签,包括:通过待训练意图识别模型对输入的所述样本文本特征和样本语音特征进行编码得到内容隐变量和意图隐变量,对所述内容隐变量和意图隐变量进行重构得到重构文本特征和重构语音特征,对从所述重构文本特征和重构语音特征中提取的意图隐变量进行融合得到第一融合意图特征表示,根据所述第一融合意图特征表示进行意图预测,得到预测意图标签。3.根据权利要求2所述的方法,其特征在于,所述通过待训练意图识别模型对输入的所述样本文本特征和样本语音特征进行编码得到内容隐变量和意图隐变量,对所述内容隐变量和意图隐变量进行重构得到重构文本特征和重构语音特征,对从所述重构文本特征和重构语音特征中提取的意图隐变量进行融合得到第一融合意图特征表示,根据所述第一融合意图特征表示进行意图预测,得到预测意图标签,包括:通过待训练意图识别模型的第一内容编码器对所述样本文本特征进行编码,得到表征样本识别文本内容的第一内容隐变量;通过所述待训练意图识别模型的第一意图编码器对所述样本文本特征进行编码,得到表征样本识别文本意图的第一意图隐变量;通过所述待训练意图识别模型的第二内容编码器对所述样本语音特征进行编码,得到表征样本语音内容的第二内容隐变量;通过所述待训练意图识别模型的第二意图编码器对所述样本语音特征进行编码,得到表征样本语音意图的第二意图隐变量;将所述第一内容隐变量和第二意图隐变量输入至所述待训练意图识别模型的第一生成器,通过所述第一生成器生成重构文本特征;将所述第二内容隐变量和第一意图隐变量输入至所述待训练意图识别模型的第二生成器,通过所述第二生成器生成重构语音特征;通过所述待训练意图识别模型的第三意图编码器对所述重构文本特征进行编码,得到表征重构文本意图的第三意图隐变量;
通过所述待训练意图识别模型的第四意图编码器对所述重构语音特征进行编码,得到表征重构语音意图的第四意图隐变量;通过所述待训练意图识别模型的融合层对所述第三意图隐变量和第四意图隐变量进行融合得到第一融合意图特征表示;将所述第一融合意图特征表示输入至所述待训练意图识别模型的预测层,通过所述预测层进行意图预测,得到预测意图标签。4.根据权利要求3所述的方法,其特征在于,所述整体损失函数还包括第一重构损失函数、第二重构损失函数和分布损失函数中的至少一种;其中,所述第一重构损失函数是根据所述样本文本特征与重构文本特征计算得到的;所述第二...
【专利技术属性】
技术研发人员:张旭龙,王健宗,程宁,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。