【技术实现步骤摘要】
非指令语音的拒识方法、车载语音识别系统及汽车
[0001]本专利技术涉及语音识别领域,具体提供一种非指令语音的拒识方法、车载语音识别系统及汽车。
技术介绍
[0002]人机交互往往伴随着语音识别的过程,机器在收到一段音频信息后,需要判断目标音频是否为指令语音。指令语音是指用户向机器发出的具有明确意图的语音。
[0003]指令语音的判断需要多维度的信息,如车辆的行驶状态、用户的语调、语速等。但是现有技术中,指令语音的判断通过只通过简单的文本识别进行判断,考虑维度低、识别准确率差,导致很多的非指令的音频会被机器误识别成指令语音。
[0004]相应地,本领域需要一种新的非指令语音内容拒识的方法来解决上述问题。
技术实现思路
[0005]为了克服上述缺陷,提出了本专利技术,以提供解决或至少部分地解决语音识别中的非指令语音容易误识别成指令语音的问题。
[0006]在第一方面,本专利技术提供一种非指令语音的拒识方法,其方法包括:
[0007]将输入音频数据进行特征提取得到语音特征向量;r/>[0008]将本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种非指令语音的拒识方法,其特征在于,包括:将输入音频数据进行特征提取得到语音特征向量;将所述语音特征向量输入语音增强系统,得到拒识特征向量、置信度、意图信息以及文本信息;基于所述拒识特征向量、所述置信度、所述意图信息以及所述文本信息,得到多模态融合特征向量;将所述多模态融合特征向量进行拒识判断,得到识别结果。2.根据权利要求1所述的非指令语音的拒识方法,其特征在于:所述语音增强系统包括语音增强模型、意图理解模型以及文本编码模型;所述将所述语音特征向量输入语音增强系统,得到拒识特征向量、置信度、意图信息以及文本信息,包括:将所述语音特征向量输入已训练的语音增强模型,得到拒识特征向量、置信度以及识别结果文本;将所述识别结果文本输入已训练的意图理解模型,得到意图信息;将所述识别结果文本输入已训练的文本编码模型,得到文本信息。3.根据权利要求1所述的非指令语音的拒识方法,其特征在于:所述基于所述拒识特征向量、所述置信度、所述意图信息以及所述文本信息,得到多模态融合特征向量包括:基于所述拒识特征向量、所述置信度、所述意图信息、所述文本信息以及车内信息,得到多模态融合特征向量。4.根据权利要求2所述的非指令语音的拒识方法,其特征在于:所述语音增强模型包括语音编码器与语音解码器;所述将所述语音特征向量输入已训练的语音增强模型,得到拒识特征向量、置信度以及识别结果文本,包括...
【专利技术属性】
技术研发人员:徐高鹏,
申请(专利权)人:蔚来汽车科技安徽有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。