语音识别模型训练方法和语音识别联邦训练系统技术方案

技术编号:27940010 阅读:32 留言:0更新日期:2021-04-02 14:21
本发明专利技术公开一种语音识别模型训练方法,包括:基于通用语音识别样本集训练初始化通用语音识别模型;基于第一自适应语音识别样本集训练所述初始化通用语音识别模型得到第一用户语音识别模型;基于第一自适应语音识别样本集和第一声学环境信息训练第一用户语音合成模型;基于所述第一用户语音合成模型所生成的合成音频更新所述初始化通用语音识别模型得到新的通用语音识别模型,用于训练第二用户语音识别模型。本发明专利技术引入“语音合成模块”,通过它来记忆“通用/用户数据”的信息。通过引入声学环境信息,表征不同的说话人、噪声环境、语速等信息,可以增加模拟生成数据的泛化能力,提升训练效果,提高训练效率。

【技术实现步骤摘要】
语音识别模型训练方法和语音识别联邦训练系统
本专利技术涉及语音识别
,尤其涉及一种语音识别模型训练方法和语音识别联邦训练系统。
技术介绍
声学模型自训练技术是指,通过将声学模型的优化训练能力以界面化或者接口的方式开放给用户(使用者),使得用户能够利用自己已完成标注的数据进行声学模型的调优。该类技术的提供者,如阿里、微软等,均是通过提供平台或接口,让用户具有自主优化语音识别模型中声学模型的能力,用户只需要按要求上传待优化场景的语音和对应标注文本,即可自主完成模型的优化。在赋能用户能够自主完成语音识别声学模型训练后,也产生了新的需求。一方面我们不单希望用户能够利用自己的数据进行模型的优化,同时也希望这些优化能够被从用户的私有化环境中拿出,作用于我们的通用模型,而以往由于数据安全的问题,我们不能够直接拿到用户的数据,这样的优化操作通常不可实现。另一方面,通用模型也在不断的优化提升中,虽然我们可以定期将优化更新的通用模型通过部署到用户环境的方式,让用户能够享受到这些提升,但是由于用于训练这些通用模型的数据通常不包含用户私有场景的数据,用户本文档来自技高网...

【技术保护点】
1.一种语音识别模型训练方法,所述方法包括:/n基于通用语音识别样本集训练初始化通用语音识别模型;/n基于第一自适应语音识别样本集训练所述初始化通用语音识别模型得到第一用户语音识别模型;/n基于第一自适应语音识别样本集和第一声学环境信息训练第一用户语音合成模型;/n基于所述第一用户语音合成模型所生成的合成音频更新所述初始化通用语音识别模型得到新的通用语音识别模型,用于训练第二用户语音识别模型。/n

【技术特征摘要】
1.一种语音识别模型训练方法,所述方法包括:
基于通用语音识别样本集训练初始化通用语音识别模型;
基于第一自适应语音识别样本集训练所述初始化通用语音识别模型得到第一用户语音识别模型;
基于第一自适应语音识别样本集和第一声学环境信息训练第一用户语音合成模型;
基于所述第一用户语音合成模型所生成的合成音频更新所述初始化通用语音识别模型得到新的通用语音识别模型,用于训练第二用户语音识别模型。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于第二自适应语音识别样本集训练所述新的通用语音识别模型得到第二用户语音识别模型;
基于第二自适应语音识别样本集和第二声学环境信息训练第二用户语音合成模型;
基于所述第二用户语音合成模型所生成的合成音频更新所述新的通用语音识别模型,用于训练其它用户语音识别模型。


3.根据权利要求1所述的方法,其特征在于,所述基于第一自适应语音识别样本集和第一声学环境信息训练第一用户语音合成模型包括:
将所述第一自适应语音识别样本集中的合成文本和所述第一声学环境信息作为输入,将对应于所述合成文本的合成音频作为目标输出进行训练得到第一用户语音合成模型。


4.根据权利要求2所述的方法,其特征在于,所述基于第二自适应语音识别样本集和第二声学环境信息训练第二用户语音合成模型包括:
将所述第二自适应语音识别样本集中的合成文本和所述第二声学环境信息作为输入,将对应于所述合成文本的合成音频作为目标输出进行训练得到第二用户语...

【专利技术属性】
技术研发人员:薛少飞
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1