一种声学模型训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33402703 阅读:29 留言:0更新日期:2022-05-11 23:24
本申请涉及一种声学模型训练方法、装置、电子设备和存储介质,该方法包括:获取多个语音以及多个语音对应的文本;训练多个语音以及多个语音对应的文本得到基础模型;根据基础模型确定目标语音对应的正向训练集和反向训练集;训练正向训练集和反向训练集得到声学模型。本申请通过基础模型在多个语音中搜索得到目标语音,在多个语音中搜索得到与目标语音发音相近的语音,目标语音组成了正向训练集,与目标语音发音相近的语音组成了反向训练集,训练正向训练集和反向训练集得到声学模型,声学模型不仅识别目标语音,而且能识别与目标语音混淆发音的语音,降低误唤醒的概率。降低误唤醒的概率。降低误唤醒的概率。

【技术实现步骤摘要】
一种声学模型训练方法、装置、电子设备和存储介质


[0001]本申请涉及模型训练
,特别是涉及一种声学模型训练方法、装置、电子设备和存储介质。

技术介绍

[0002]在边缘侧设备做语音唤醒或者命令词识别,受资源限制,其声学模型体积比较小,性能比较弱。一般解决方法是,先使用大量带标注的语音训练一个基础模型,然后录制一些目标词的录音,然后使用这些录音对基础模型做自适应训练,以使模型更偏向于对目标词的准确识别。
[0003]为了优化识别率,一般需要找至少上百人录制目标词的声音,这使得模型优化过程无法快速自动复制,影响了项目实施的速度。不同产品往往使用个性化的唤醒词和命令词,因此积累的录音也无法完全满足新产品的需求。而且,录音也需要资金投入,增加成本。

技术实现思路

[0004]基于上述问题,本申请提供一种声学模型训练方法、装置、电子设备和存储介质。
[0005]第一方面,本申请实施例提供一种声学模型训练方法,包括:
[0006]获取多个语音以及多个语音对应的文本,训练多个语音以及多个语音对应的文本得到基础模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声学模型训练方法,其特征在于,包括:获取多个语音以及多个语音对应的文本,训练所述多个语音以及多个语音对应的文本得到基础模型;根据所述基础模型确定目标语音对应的正向训练集和反向训练集;训练所述正向训练集和所述反向训练集得到声学模型。2.根据权利要求1所述的一种声学模型训练方法,其特征在于,所述根据所述基础模型确定目标语音对应的正向训练集,包括:所述基础模型在所述多个语音中搜索得到目标语音;根据所述目标语音和所述目标语音对应的文本确定每个字的语音边界信息;根据所述每个字的语音边界信息确定目标语音中每个字的语音从而得到目标文本对应的正向训练集。3.根据权利要求1所述的一种声学模型训练方法,其特征在于,所述根据所述基础模型确定目标语音对应的反向训练集,包括:所述基础模型在所述多个语音中搜索得到与目标语音发音相近的语音;根据所述目标语音发音相近的语音和所述目标语音发音相近的语音对应的文本确定每个字的语音边界信息;根据所述每个字的语音边界信息确定目标语音中每个字的语音从而得到目标语音对应的反向训练集。4.根据权利要求2所述的一种声学模型训练方法,其特征在于,所述目标语音对应的文本和目标文本是相同的文本。5.根据权利要求3所述的一种声学模型训练方法,其特征在于,所述目标语音发音...

【专利技术属性】
技术研发人员:李鹏许东星梁家恩
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1