System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种语音识别方法、装置、设备和存储介质制造方法及图纸_技高网

一种语音识别方法、装置、设备和存储介质制造方法及图纸

技术编号:40553587 阅读:12 留言:0更新日期:2024-03-05 19:13
本申请公开了一种语音识别方法、装置、设备和存储介质,其中,语音识别方法包括:获取待识别语音;基于语音识别模型对待识别语音进行识别,得到待识别语音的目标识别文本;其中,语音识别模型基于样本语音训练得到,样本语音标注有样本语音的样本真实文本以及样本真实文本的实体掩膜,实体掩膜与样本真实文本长度相同,且实体掩膜用于指示样本真实文本中样本领域实体的所在位置。上述方案,能够提高语音识别的准确率,尤其是在待识别语音中含有领域实体情况下的识别准确率。

【技术实现步骤摘要】

本申请涉及语音识别,特别是涉及一种语音识别方法、装置、设备和存储介质


技术介绍

1、语音识别技术是一种将语音信号转换为文字序列的技术,它已经被广泛应用于各种领域,例如语音助手、语音搜索、语音输入等应用。

2、以asr(automatic speech recognition,自动语音识别)模型为例,asr模型的性能很大程度上依赖于训练数据的质量和数量。然而,由于不同领域的数据分布之间存在很大的差异性,用某个领域数据训练好的asr模型在新领域的表现可能会很差。

3、因此,如何提高语音识别的准确率,尤其是在待识别语音中含有领域实体情况下的识别准确率,成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种语音识别方法、装置、设备和存储介质,能够提高语音识别的准确率,尤其是在待识别语音中含有领域实体情况下的识别准确率。

2、为了解决上述技术问题,本申请第一方面提供了一种语音识别方法,语音识别方法包括:获取待识别语音;基于语音识别模型对待识别语音进行识别,得到待识别语音的目标识别文本;其中,语音识别模型基于样本语音训练得到,样本语音标注有样本语音的样本真实文本以及样本真实文本的实体掩膜,实体掩膜与样本真实文本长度相同,且实体掩膜用于指示样本真实文本中样本领域实体的所在位置。

3、为了解决上述技术问题,本申请第二方面提供了一种语音识别装置,语音识别装置包括获取模块和识别模块,获取模块用于获取待识别语音,识别模块用于基于语音识别模型对待识别语音进行识别,得到待识别语音的目标识别文本,其中,语音识别模型基于样本语音训练得到,样本语音标注有样本语音的样本真实文本以及样本真实文本的实体掩膜,实体掩膜与样本真实文本长度相同,且实体掩膜用于指示样本真实文本中样本领域实体的所在位置。

4、为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括通信电路、存储器和处理器,通信电路、存储器分别与处理器耦接,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的语音识别方法。

5、为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的语音识别方法。

6、上述方案,获取待识别语音,再基于语音识别模型对待识别语音进行识别,得到待识别语音的目标识别文本,语音识别模型基于样本语音训练得到,样本语音标注有样本语音的样本真实文本以及样本真实文本的实体掩膜,实体掩膜与样本真实文本长度相同,且实体掩膜用于指示样本真实文本中样本领域实体的所在位置。因此,通过实体掩膜指示样本领域实体在样本真实文本中的所在位置,使得在基于样本语音训练时语音识别模型对样本真实文本中样本领域实体部分进行针对性学习,以提高语音识别模型对领域实体的关注度,从而有助于提升语音识别模型对领域实体的识别能力,进而再基于语音识别模型识别待识别语音,能够提高语音识别的准确率,尤其是在待识别语音中含有领域实体情况下的识别准确率。

本文档来自技高网...

【技术保护点】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述语音识别模型的训练步骤包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述实体掩膜,确定对应所述字符位置的损失权重,包括:

4.根据权利要求1所述的方法,其特征在于,所述样本语音的获取步骤包括:

5.根据权利要求1所述的方法,其特征在于,所述样本领域实体属于目标领域,所述实体掩膜的获取步骤包括:

6.根据权利要求1所述的方法,其特征在于,所述样本领域实体属于目标领域,所述样本真实文本的获取步骤包括:

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.一种语音识别装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括通信电路、存储器和处理器,所述通信电路、所述存储器分别与所述处理器耦接,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至7任一项所述的语音识别方法。

10.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至7任一项所述的语音识别方法。

...

【技术特征摘要】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述语音识别模型的训练步骤包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述实体掩膜,确定对应所述字符位置的损失权重,包括:

4.根据权利要求1所述的方法,其特征在于,所述样本语音的获取步骤包括:

5.根据权利要求1所述的方法,其特征在于,所述样本领域实体属于目标领域,所述实体掩膜的获取步骤包括:

6.根据权利要求1所述的方法,其特征在于,所述样本领域实体属于目标...

【专利技术属性】
技术研发人员:胡今朝马志强吴重亮李永超吴明辉方昕
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1