【技术实现步骤摘要】
语音识别方法及语音识别装置、电子设备、存储介质
[0001]本申请涉及人工智能
,尤其涉及一种语音识别方法及语音识别装置、电子设备、存储介质。
技术介绍
[0002]自动语音识别技术(automatic speech recognition,ASR)是一种将人的语音转换为文本的技术。目前的自动语音识别模型通常会采用编码器
‑
解码器架构,然而,这种模型架构需要利用已生成词预测语句中下一位置的词,导致语音识别的解码效率不高。因此,如何提高自动语音识别的效率成为亟待解决的技术问题。
技术实现思路
[0003]本申请实施例的主要目的在于提出一种语音识别方法及语音识别装置、电子设备、存储介质,能够提高自动语音识别的效率。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种语音识别方法,所述方法包括:获取语音信息;获取语音识别模型,所述语音识别模型包括第一编码模块、第一对齐模块、第一屏蔽模块、第一校正模块和第一解码模块;将所述语音信息输入所述第一编码模块中进行编码处理,得到第一编 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取语音信息;获取语音识别模型,所述语音识别模型包括第一编码模块、第一对齐模块、第一屏蔽模块、第一校正模块和第一解码模块;将所述语音信息输入所述第一编码模块中进行编码处理,得到第一编码向量;将所述第一编码向量输入所述第一解码模块中进行解码处理,得到解码文本序列;将所述第一编码向量输入所述第一对齐模块中进行对齐处理,得到第一文本序列,所述第一文本序列与所述解码文本序列对齐,且所述第一文本序列中包括至少两个第一文本标签;将所述第一文本序列输入所述第一屏蔽模块,通过所述第一屏蔽模块屏蔽至少一个所述第一文本标签,得到目标文本序列;将所述解码文本序列和所述目标文本序列输入所述第一校正模块中进行校正处理,得到语音识别文本。2.根据权利要求1所述的方法,其特征在于,所述将所述第一文本序列输入所述第一屏蔽模块,通过所述第一屏蔽模块屏蔽至少一个所述第一文本标签,得到目标文本序列,包括:获取每个所述第一文本标签对应的置信度;将所述第一文本序列输入所述第一屏蔽模块,并通过所述第一屏蔽模块,从所述第一文本序列中获取置信度小于预设值的第一文本标签以作为待屏蔽标签;通过所述第一屏蔽模块,在所述第一文本序列中对所述待屏蔽标签进行屏蔽处理,得到目标文本序列。3.根据权利要求1所述的方法,其特征在于,所述语音识别模型的训练步骤包括:构建初始生成模型,所述初始生成模型包括第二编码模块、第二对齐模块、第二屏蔽模块、第二校正模块和第二解码模块;获取语音样本以及所述语音样本对应的参考识别文本;将所述语音样本输入第二编码模块中进行编码处理,得到第二编码向量;将所述第二编码向量输入第二对齐模块中进行对齐处理,得到第二文本序列,所述第二文本序列中包括至少两个第二文本标签;将所述第二文本序列输入所述第二屏蔽模块中,通过所述第二屏蔽模块屏蔽至少一个所述第二文本标签,得到第三文本序列;将所述第二编码向量输入所述第二解码模块中进行解码处理,得到第四文本序列;将所述第三文本序列和所述第四文本序列输入所述第二校正模块中进行校正处理,得到目标识别文本;根据所述参考识别文本和所述目标识别文本对所述初始生成模型进行调整,得到语音识别模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述参考识别文本和所述目标识别文本对所述初始生成模型进行调整,得到语音识别模型,包括:根据预设的损失函数、所述参考识别文本和所述目标识别文本,计算所述初始生成模型的损失函数值;
若所述损失函数值满足预设的训练结束条件,则根据所述初始生成模型确定语音识别模型;若所述损失函数值未满足所述训练结束条件,则继续执行所述获取语音样本以及所述语音样本对应的参考识别文本的步骤;所述方法还包括:若所述损失函数值满...
【专利技术属性】
技术研发人员:张旭龙,王健宗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。