【技术实现步骤摘要】
一种语音识别方法、装置、设备及存储介质
[0001]本专利技术涉及语音识别
,尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
[0002]语音识别技术为将语音识别为文本的技术。目前的语音识别方案为基于语音识别模型的方案,该方案基于预先训练得到的语音识别模型对待识别语音进行识别,以得到识别结果。
[0003]目前的语音识别方案中所使用过的语音识别模型通常基于交叉熵准则进行训练得到,然而,仅基于交叉熵准则进行训练得到的语音模型的识别性能不佳,进而导致基于训练得到的语音识别模型进行语音识别时,难以获得较好的识别效果。
技术实现思路
[0004]有鉴于此,本专利技术提供了一种语音识别方法、装置、设备及存储介质,用以解决目前的语音识别方案识别效果不佳的问题,其技术方案如下:
[0005]一种语音识别方法,包括:
[0006]获取待识别语音;
[0007]基于预先训练得到的语音识别模型对所述待识别语音进行识别;
[0008]其中,所述语音识别模型通过两个阶段的训练得到,第一阶段以使训练语音的识别结果与训练语音标注的文本一致为目标进行训练,第二阶段以平衡训练语音的语音识别结果的文本单元错误率与语义可接受度为目标进行训练。
[0009]可选的,第一阶段训练得到语音识别基线模型,第二阶段对所述语音识别基线模型进行训练;
[0010]对所述语音识别基线模型进行训练,包括:
[0011]基于所述语音识别基线模型对训练语音进行识别,得到训练语音 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获取待识别语音;基于预先训练得到的语音识别模型对所述待识别语音进行识别;其中,所述语音识别模型通过两个阶段的训练得到,第一阶段以使训练语音的识别结果与训练语音标注的文本一致为目标进行训练,第二阶段以平衡训练语音的语音识别结果的文本单元错误率与语义可接受度为目标进行训练。2.根据权利要求1所述的语音识别方法,其特征在于,第一阶段训练得到语音识别基线模型,第二阶段对所述语音识别基线模型进行训练;对所述语音识别基线模型进行训练,包括:基于所述语音识别基线模型对训练语音进行识别,得到训练语音的若干候选识别结果;确定每个候选识别结果对应的文本单元错误率和语义变化评估指标,其中,所述语义变化评估指标能够反映对应的候选识别结果相对于训练语音的标注文本的语义变化;结合每个候选识别结果对应的文本单元错误率和语义变化评估指标,确定所述语音识别基线模型在每个候选识别结果上的预测损失;根据确定出的预测损失对所述语音识别基线模型进行参数更新。3.根据权利要求2所述的语音识别方法,其特征在于,所述结合每个候选识别结果对应的文本单元错误率和语义变化评估指标,确定所述语音识别基线模型在每个候选识别结果上的预测损失,包括:针对每个候选识别结果:根据该候选识别结果对应的文本单元错误率和语义变化评估指标,确定该候选识别结果对应的权重;根据该候选识别结果对应的权重和该候选识别结果对应的预测概率,确定所述语音识别基线模型在该候选识别结果上的预测损失。4.根据权利要求2所述的语音识别方法,其特征在于,所述语义变化评估指标包括:词性偏离度和/或句法范畴偏离度;所述词性偏离度能够反映对应候选识别结果在词性上相对于训练语音的标注文本的偏离程度;所述句法范畴偏离度能够反映对应候选识别结果在句法范畴上相对于训练语音的标注文本的偏离程度。5.根据权利要求3所述的语音识别方法,其特征在于,所述根据该候选识别结果对应的文本单元错误率和语义变化评估指标,确定该候选识别结果对应的权重,包括:计算该候选识别结果对应的文本单元错误率与平均文本单元错误率的差值、该候选识别结果对应的词性偏离度与平均词性偏离度的差值、该候选识别结果对应的句法范畴偏离度与平均句法范畴偏离度的差值,其中,所述平均字错误率为所述若干候选识别结果分别对应的文本单元错误率的平均值,所述平均词性偏离度为所述若干候选识别结果分别对应的词性偏离度的平均值,所述平均句法范畴偏离度为所述若干候选识别结果分别对应的句法范畴偏离度的平均值;将计算得到的各个差值融合,融合结果作为该候选识别结果对应的权重。
6.根据权利要求4所述的语音识别方法,其特征在于,确定一条候选识别结果对应的词性偏离度,包括:确定训练语音的标注文本包含的各个词的词性,并确定该候选识别结果与训练语音的...
【专利技术属性】
技术研发人员:万根顺,王磊奇,潘嘉,高建清,刘聪,胡国平,刘庆峰,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。