一种语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：29159900 阅读：20 留言：0更新日期：2021-07-06 23:00

一种语音识别方法、装置、设备及存储介质。本发明专利技术实施例的技术方案，通过获取待识别的语音；将所获取语音输入到至少两种语音识别器中，输出各自语音识别器对应的最优识别结果；将各个语种的最优识别结果分别输入对应语法的识别结果处理器，进行基于语法的置信度校准，输出对应语法识别结果的置信度；将各语法的置信度结果一并送入置信度判决器，进行置信度判决，确定最终识别结果与对应语种；将通过置信度判决的语种所对应的识别结果输出至用户界面，同时返回该识别结果对应的语种，解决了应用在一些场景下需要识别两种或多种语种的语音时，需要用户主动选择的问题，且识别时延低。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法、装置、设备及存储介质
本专利技术实施例涉及语音识别
，尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
语音识别技术已经广泛应用于各种应用中。现在，有很多应用的语音识别功能需要同时支持两种甚至更多种语言。为了让每种语言的识别性能达到最好，通常的实现方式是为每种语言单独部署服务，即在前端操作界面要求用户选择所使用的语言，然后调用相应语言的功能模块。但在一些特定场景下，例如会议记录场景，这种切换操作不方便实现与操作。还有一类实现方式是把语音先做语种分类，然后送往相对应的语种语音识别服务。这种实现方式往往会为识别带来延迟。因为需要先给语种分类器足够多的数据让它产生可靠的判断结果后，再将缓存的语音和后续语音送给后面相应语种的识别器。
技术实现思路
本专利技术实施例提供了一种语音识别方法、装置、设备及存储介质，可以提高语音识别与判别的便利性，无需用户主动选择，且减少延迟。第一方面，本专利技术实施例提供了一种语音识别方法，该方法包括：获取待识别的语音；将所获取语音输入到至少两种语音识别器中，输出各自语音识别器对应的最优识别结果；将各个语种的最优识别结果分别输入对应语法的识别结果处理器，进行基于语法的置信度校准，输出对应语法识别结果的置信度；将各语法的置信度结果一并送入置信度判决器，进行置信度判决，确定最终识别结果与对应语种；输出通过置信度判决的语种所对应的识别结果，同时输出该识别结果对应的语种。第二方面，本专利技...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n获取待识别的语音；/n将所获取语音输入到至少两种语音识别器中，输出各自语音识别器对应的最优识别结果；/n将各个语种的最优识别结果分别输入对应语法的识别结果处理器，进行基于语法的置信度校准，输出对应语法识别结果的置信度；/n将各语法的置信度结果一并送入置信度判决器，进行置信度判决，确定最终识别结果与对应语种；/n输出通过置信度判决的语种所对应的识别结果，同时输出该识别结果对应的语种。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
获取待识别的语音；
将所获取语音输入到至少两种语音识别器中，输出各自语音识别器对应的最优识别结果；
将各个语种的最优识别结果分别输入对应语法的识别结果处理器，进行基于语法的置信度校准，输出对应语法识别结果的置信度；
将各语法的置信度结果一并送入置信度判决器，进行置信度判决，确定最终识别结果与对应语种；
输出通过置信度判决的语种所对应的识别结果，同时输出该识别结果对应的语种。

2.根据权利要求1所述的方法，其特征在于，所述将各个语种的最优识别结果分别输入对应语法的识别结果处理器，进行基于语法的置信度校准，输出对应语法识别结果的置信度，包括：
将最优识别结果转换为语法受限识别，用语法强制对齐的方式单纯评估输入语音。

3.根据权利要求2所述的方法，其特征在于，所述将各语法的置信度结果一并送入置信度判决器，进行置信度判决，确定最终识别结果与对应语种，包括：
对各语法的置信度结果进行排序，置信度最高且超出绝对置信度的语种即判决为所获取语音所使用的语种，则输出对应的识别结果与语法；
如各语法的置信度结果中，最高置信度小于绝对置信度，则不输出任何结果。

4.根据权利要求2所述的方法，其特征在于，所诉将最优识别结果转换为语法受限识别，包括：根据解码器的语法编译技术，将最优识别结果分别组织成语法形式，所述语法形式包括ABNF或者JSG。

5.根据权利要求3所述的方法，其特征在于，所述对各语法的置信度结果进行排序，置信度最高且大于绝对置信度的语种即判决为所获取语音所使用的语种，包括：
所述绝对置信度数值范围为0.4～1。

【专利技术属性】
技术研发人员：徐燃，
申请(专利权)人：北京儒博科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人