【技术实现步骤摘要】
本专利技术涉及音频处理,尤其涉及一种语音识别方法、装置、电子设备和存储介质。
技术介绍
1、语音识别系统功能为帮助说话人将语音转换为文本。具体来说,说话人的语音以数据形式送入语音识别系统,经过一些前置处理如降噪、分句,以及提取声学特征等等操作得到语音识别系统的输入。经过语音识别模型后返回识别的文本内容并输出。当前自动语音识别技术(asr)可以分为传统的基于统计的方法以及基于神经网络的端到端语音识别。
2、但是,在实际应用中存在同一句话,也有可能某一小段声音变小或者环境嘈杂导致其相对其他片段更难听清具体的含义,而现有的语音识别模型通常是对整个待识别语音数据进行无差别的语音识别。由此,现有的语音识别模型的识别效果并不理想。
技术实现思路
1、本专利技术提供一种语音识别方法、装置、电子设备和存储介质,用以解决现有技术中针对包含识别难度较高的待识别语音的语音识别效果不佳的缺陷。
2、本专利技术提供一种语音识别方法,包括:
3、获取待识别语音;
4、确
...【技术保护点】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的语音识别方法,其特征在于,所述确定所述待识别语音中各语音帧所属音素的预测难易程度,包括:
3.根据权利要求2所述的语音识别方法,其特征在于,所述基于所述当前轮次下各语音帧所属音素的概率,确定当前轮次下所述各语音帧所属音素的预测难易程度,包括:
4.根据权利要求3所述的语音识别方法,其特征在于,所述当前轮次下的概率阈值大于等于上一轮次下的概率阈值。
5.根据权利要求1所述的语音识别方法,其特征在于,所述基于与所述预测难易程度对应的特征提取方式,提取所述各语音
...【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的语音识别方法,其特征在于,所述确定所述待识别语音中各语音帧所属音素的预测难易程度,包括:
3.根据权利要求2所述的语音识别方法,其特征在于,所述基于所述当前轮次下各语音帧所属音素的概率,确定当前轮次下所述各语音帧所属音素的预测难易程度,包括:
4.根据权利要求3所述的语音识别方法,其特征在于,所述当前轮次下的概率阈值大于等于上一轮次下的概率阈值。
5.根据权利要求1所述的语音识别方法,其特征在于,所述基于与所述预测难易程度对应的特征提取方式,提取所述各语音帧的语音特征,包括:
6.根据权利要求1至5中任一项所述的语...
【专利技术属性】
技术研发人员:任继刚,万根顺,王孟之,高建清,刘聪,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。