语音意图识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37797860 阅读：26 留言：0更新日期：2023-06-09 09:27

本发明专利技术涉及人工智能技术领域，提供一种语音意图识别方法、装置、电子设备及存储介质，在接收到语音的意图识别指令后，通过在现有的预训练语言模型的MLM任务基础上，获取所述语音的转译文本及获取与所述转译文本对应的转写文本，易混淆词(如寿险和首先)的词向量在词向量空间中会被拉近，从而使词向量除了包含语义信息外，也包含了语音信息。包含转译错误的转译文本和正确的转写文本之间的差异被缩小，进而基于相似文本对对预训练语言模型进行微调得到的意图识别模型，对语音转译错误的鲁棒性更强，提升了整体意图识别的准确率。提升了整体意图识别的准确率。提升了整体意图识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音意图识别方法、装置、电子设备及存储介质

[0001]本专利技术涉及人工智能
，具体涉及一种语音意图识别方法、装置、电子设备及存储介质。

技术介绍

[0002]智能语音客服系统已经广泛应用于各个行业中，如保险、银行、电信、电商等。智能语音客服识别用户以语音形式提出的问题，通过语义分析理解用户意图，并以拟人化的方式与用户沟通，向用户提供信息咨询等相关服务。目前的智能语音客服系统的核心是进行用户意图识别，明确用户意图后给出针对性的回答。
[0003]专利技术人在实现本专利技术的过程中发现，现有技术中对用户意图识别的主要方式为先通过语音识别将用户语音转译为文本，再将转译文本输入NLU模块识别用户意图。NLU模块普遍的做法是用业务标注数据在预训练语言模型上进行微调。但是，通常业务标注数据和预训练语言模型的数据都是文本数据，而线上数据为语音识别的转译文本，两者的数据分布存在一定差异，对意图识别的准确度造成一定影响。

技术实现思路

[0004]鉴于以上内容，有必要提出一种语音意图识别方法、装置、电子设备及...

【技术保护点】

【技术特征摘要】
1.一种语音意图识别方法，其特征在于，所述方法包括：响应于对语音的意图识别指令，获取所述语音的转译文本及获取与所述转译文本对应的转写文本；基于所述转译文本和所述转写文本生成相似文本对；调用意图识别模型对所述相似文本对进行识别并输出所述语音的意图；其中，所述意图识别模型为根据预训练语言模型进行微调得到的。2.如权利要求1所述的语音意图识别方法，其特征在于，所述方法还包括：获取多个文本语料、多个历史转译文本及每个历史转译文本对应的历史转写文本；基于所述多个文本语料预训练所述语言模型；基于所述多个历史转译文本及每个历史转译文本对应的历史转写文本对所述语言模型进行微调，得到意图识别模型。3.如权利要求1所述的语音意图识别方法，其特征在于，所述获取所述语音的转译文本包括：将所述语音切分为多个语音切片；对每个所述语音切片进行语音识别，得到语音文本；对多个所述语音文本进行文本聚合，得到所述语音的转译文本。4.如权利要求2所述的语音意图识别方法，其特征在于，所述将所述语音切分为多个语音切片包括：生成所述语音的波形图；根据所述波形图中的语音波形，确定所述语音中的停顿；根据所述语音中的停顿，将所述语音切分为多个语音切片。5.如权利要求1至4中任意一项所述的语音意图识别方法，其特征在于，所述获取与所述转译文本对应的转写文本包括：对所述转译文本进行文本纠错，得到所述转写文本。6.如权利要求1至4中任意一项所述的语音意图识别方法，其特征在于，所述获取与所述转译文本对应的转写文本包括：提供语...

【专利技术属性】
技术研发人员：孙金辉，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人