语音识别方法、装置、设备、介质及程序产品制造方法及图纸

技术编号：32670731 阅读：19 留言：0更新日期：2022-03-17 11:25

本公开提供了语音识别方法、装置、设备、介质及程序产品，涉及计算机技术领域，尤其涉及语音技术领域。具体实现方案为：基于至少两个语音识别场景，分别对待识别语音进行语音识别，得到至少两个候选识别文本；分别对候选识别文本和待识别语音进行特征提取得到候选文本特征和语音特征；依据候选文本特征和语音特征，确定候选识别文本的置信度；依据候选识别文本的置信度，确定待识别语音的语音识别结果。本公开实施例的技术方案，可以提高语音识别的准确度。别的准确度。别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备、介质及程序产品

[0001]本公开涉及计算机
，尤其涉及语音
，具体涉及一种语音识别方法、装置、设备、介质及程序产品。

技术介绍

[0002]语音识别技术是计算机识别和理解人类输入的语音信号，并把语音信号转变为相应的文本或命令的技术，是实现人与机器交互的重要途径之一。
[0003]语音识别技术现在已广泛应用于各种场景，例如，语音搜索、车载导航、语音输入法以及智能音箱等场景。随着语音识别应用场景的不断丰富，用户对语音识别的准确率也有了更高的要求。

技术实现思路

[0004]本公开提供了一种语音识别方法、装置、设备、介质及程序产品。
[0005]根据本公开的一方面，提供了一种语音识别方法，包括：
[0006]基于至少两个语音识别场景，分别对待识别语音进行语音识别，得到至少两个候选识别文本；
[0007]分别对所述候选识别文本和所述待识别语音进行特征提取得到候选文本特征和语音特征；
[0008]依据所述候选文本特征和语音特征，确定所述候选识别文本的置信度；
[0009]依据所述候选识别文本的置信度，确定所述待识别语音的语音识别结果。
[0010]根据本公开的另一方面，提供了一种语音识别装置，包括：
[0011]候选识别文本确定模块，用于基于至少两个语音识别场景，分别对待识别语音进行语音识别，得到至少两个候选识别文本；
[0012]特征提取模块，用于分别对所述候选识别文本和所述待识别语音进行特征提取得...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，包括：基于至少两个语音识别场景，分别对待识别语音进行语音识别，得到至少两个候选识别文本；分别对所述候选识别文本和所述待识别语音进行特征提取得到候选文本特征和语音特征；依据所述候选文本特征和语音特征，确定所述候选识别文本的置信度；依据所述候选识别文本的置信度，确定所述待识别语音的语音识别结果。2.根据权利要求1所述的方法，其中，所述基于至少两个语音识别场景，分别对待识别语音进行语音识别，得到至少两个候选识别文本，包括：采用至少两个解码器，分别对所述待识别语音进行语音识别，得到至少两个候选识别文本；其中，所述解码器采用设定语音识别场景中的语音样本确定。3.根据权利要求2所述的方法，其中，所述解码器包括针对语音搜索场景的解码器、针对语音输入法场景的解码器、针对语音指令场景的解码器、针对语音数据挖掘场景的解码器以及针对语音交互场景的解码器中的至少一项。4.根据权利要求1所述的方法，所述依据所述候选识别文本的置信度，确定所述待识别语音的语音识别结果，包括：根据候选识别文本的置信度，从所述候选识别文本中选择目标识别文本；在所述目标识别文本的置信度低于第一置信度阈值的情况下，对所述目标识别文本进行纠错，将纠错结果作为待识别语音的语音识别结果。5.根据权利要求4所述的方法，其中，所述对所述目标识别文本进行纠错，包括：将所述目标识别文本中置信度小于第二置信度阈值的字符，作为待纠错字符；依据所述待纠错字符关联的音素，以及所述目标识别文本中所述待纠错字的上下文信息，预测所述待纠错字所处位置的替换字，并采用所述替换字替换所述待纠错字。6.根据权利要求1
‑
5任一所述的方法，其中，所述依据所述候选文本特征和语音特征，确定所述候选识别文本的置信度，包括：对所述候选识别文本中的字符和待识别语音中的音素进行对齐，得到候选识别文本中字符所关联的音素；将候选文本特征中字符的文本特征，与语音特征中关联音素的音素特征进行匹配，得到候选识别文本中字符的置信度；根据所述字符的置信度，确定候选识别文本的置信度。7.一种语音识别装置，包括：候选识别文本确定模块，用于基于至少两个语音识别场景，分别对待识别语音进行语音识别，得到至少两个候选识别文本；特征提取模块，用于分别对所述候选识别文本和所述待识别语音进行特征提取得到候选文本特征和语音特征；置信度确定模块，用于依据所述候选文本特征和语音特征，确定所述候选识别文本的置信度；语音识别结果确定模块，用于依据所述候选识别文本的置信度，确定所...

【专利技术属性】
技术研发人员：王常刚，蒋正翔，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人