【技术实现步骤摘要】
经由深度前馈神经网络使用自然语言理解相关知识的语音识别相关申请的交叉引用本申请要求2019年5月10日提交的美国临时申请序列号No.62/846,340的权益,该美国申请的公开内容在其整体上通过引用并入本文中。
本公开总体上涉及自动语音识别领域,并且更具体地,涉及改进利用一个或多个语音识别引擎的语音识别系统的操作的系统和方法。
技术介绍
自动语音识别是在广泛的应用中实现人机接口(HMI)的重要技术。特别地,在其中人类用户需要专注于执行任务的情况下,语音识别是有用的,在这种情况下,使用诸如鼠标和键盘的传统输入设备是不方便或不切实际的。例如,车载“信息娱乐”系统、家庭自动化系统以及小型电子移动设备(诸如智能手机、平板电脑和可穿戴计算机)的许多用途可以采用语音识别来接收来自用户的基于语音的命令和其它输入。
技术实现思路
框架对由一个或多个ASR引擎为每个输入语音话语生成的多个假设进行排名。所述框架联合实现了ASR改进和NLU。它利用NLU相关知识来促进竞争假设的排名,并且将排名最高的假设 ...
【技术保护点】
1.一种由控制器执行的用于系统中的语音识别的方法,包括:/n从语音输入解析多个候选语音识别结果;/n从第一语音识别引擎接收来自所述多个候选语音识别结果中的每个的第一多个特征向量,所述第一多个特征向量包括第一置信度得分;/n从不同于所述第一语音识别引擎的第二语音识别引擎接收来自所述多个候选语音识别结果中的每个的第二多个特征向量,所述第二多个特征向量包括低于所述第一置信度得分的第二置信度得分;/n基于自然语言理解(NLU)信息,从所述多个候选语音识别结果中的每个中提取NLU结果;/n基于所述NLU结果和NLU相关特征,经由共享投影层将所述第一多个特征向量和所述第二多个特征向量压 ...
【技术特征摘要】
20190510 US 62/8463401.一种由控制器执行的用于系统中的语音识别的方法,包括:
从语音输入解析多个候选语音识别结果;
从第一语音识别引擎接收来自所述多个候选语音识别结果中的每个的第一多个特征向量,所述第一多个特征向量包括第一置信度得分;
从不同于所述第一语音识别引擎的第二语音识别引擎接收来自所述多个候选语音识别结果中的每个的第二多个特征向量,所述第二多个特征向量包括低于所述第一置信度得分的第二置信度得分;
基于自然语言理解(NLU)信息,从所述多个候选语音识别结果中的每个中提取NLU结果;
基于所述NLU结果和NLU相关特征,经由共享投影层将所述第一多个特征向量和所述第二多个特征向量压缩到所述共享投影层;
进一步基于所述NLU结果和NLU相关特征将所述共享投影层压缩到第二投影层;
经由神经网络排名器将排名得分与所述多个候选语音识别结果中的每个相关联,所述排名得分基于所述多个特征向量和所述多个候选语音识别结果中的每个的所述NLU结果,其中所述神经网络排名器基于所述NLU相关特征将所述第二置信度得分提高到大于所述第一置信度得分;
从所述多个候选语音识别结果中选择与具有最高值的排名得分相关联的语音识别结果;以及
使用从所述多个候选语音识别结果中选择的与最高排名得分相对应的语音识别结果作为输入来操作所述系统。
2.根据权利要求1所述的方法,其中所述神经网络排名器是深度前馈神经网络排名器。
3.根据权利要求1所述的方法,其中所述压缩是经由共享投影矩阵进行的。
4.根据权利要求3所述的方法,进一步包括响应于第一多个特征向量和第二多个特征向量小于阈值大小,由控制器绕过所述共享投影层和第二投影层,使得所述第二多个特征向量被直接馈送到神经网络排名器,其中特征向量的阈值大小小于每个假设2个特征。
5.根据权利要求4所述的方法,其中第一多个特征向量和第二多个特征向量包括多个置信度得分,并且进一步包括:
由控制器基于所述多个置信度得分执行线性回归处理,以针对所述第一多个特征向量和第二多个特征向量中的每个生成归一化的多个置信度得分,所述归一化的多个置信度得分基于多个候选语音识别结果中的一个预定候选语音识别结果的置信度得分。
6.根据权利要求1所述的方法,其中NLU信息是基于槽位的触发特征或表示槽位和意图敏感的语句嵌入的语义特征。
7.根据权利要求6所述的方法,其中第一语音识别引擎是特定领域的语音识别引擎,并且第二语音识别引擎是通用语音识别引擎或基于云的语音识别引擎。
8.根据权利要求7所述的方法,其中第一多个特征向量和第二多个特征向量包括双向长短期记忆(BLSTM)特征。
9.一种由控制器执行的用于系统中的语音识别的方法,包括:
从语音输入解析多个候选语音识别结果;
经由第一语音识别引擎从所述多个候选语音识别结果中的每个中提取第一多个特征向量;
经由不同于所述第一语音识别引擎的第二语音识别引擎从所述多个候选语音识别结果的每个中提取第二多个特征向量;
基于自然语言理解(NLU)信息,从所述多个候选语音识别结果中的每个中提取NLU结果;
基于所述NLU结果和NLU相关特征,经由共享投影层将所述第一多个特征向量和所述第二多个特征向量压缩到所述共享投影层;
进一步基于所述NLU结果和NLU相关特征将所述共享投影层压缩到第二投影层;
经由神经网络排名器将排名...
【专利技术属性】
技术研发人员:Z周,X宋,
申请(专利权)人:罗伯特·博世有限公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。