语音识别模型训练方法及语音识别方法技术

技术编号：29590382 阅读：16 留言：0更新日期：2021-08-06 19:50

本发明专利技术公开一种语音识别模型训练方法，包括：采用多语言样本集对语音识别模型进行预训练得到初始语音识别模型，所述多语言样本集中包括目标语言样本集；采用预先训练得到的语言分类器确定目标语言的后验概率；根据所述后验概率在基于所述多语言样本集进行训练过程中进行数据加权；至少根据数据加权结果训练所述初始语音识别模型；采用所述目标语言样本集对训练后的初始语音识别模型进行调整。本发明专利技术为了利用目标语言和源语言之间的相似性进行ASR训练，采用目标语言的后验概率对多语言样本集中的样本进行加权处理，从而在多语言数据集中找到与目标语言更相似的数据，以实现更好的适应性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别模型训练方法及语音识别方法
本专利技术涉及语音识别
，尤其涉及一种语音识别模型训练方法及语音识别方法。
技术介绍
自动语音识别(ASR)是人机交互的入口，在研究界和行业界都引起了极大的关注。然而，训练最先进的语音识别系统通常需要成百上千小时的转录语音。尽管世界上有超过6000种语言，但其中大多数都遭受标注数据不足的困扰。对于许多语言，只有少数带标注的数据可用。为了解决资源短缺情况下的数据稀疏性问题，对于多语言ASR或多语言预训练，现有技术只需将来自不同语言的数据或根据多项分布的发声样本进行组合，以减轻数据不平衡。但是他们没有考虑语言之间的关系和相关性。
技术实现思路
本专利技术实施例提供一种语音识别模型训练方法及语音识别方法，用于至少解决上述技术问题之一。第一方面，本专利技术实施例提供一种语音识别模型训练方法，包括：采用多语言样本集对语音识别模型进行预训练得到初始语音识别模型，所述多语言样本集中包括目标语言样本集；采用预先训练得到的语言分类器确定目标语言的后验概率；根据所述后验概率在基于所述多语言样本集进行训练过程中进行数据加权；至少根据数据加权结果训练所述初始语音识别模型；采用所述目标语言样本集对训练后的初始语音识别模型进行调整。第二方面，本专利技术实施例提供一种语音识别方法，其特征在于，包括：接收待识别语料，所述待识别语料为目标语料；采用本专利技术所述的语音识别模型训练方法训练得到的语音识别模型对所述...

【技术保护点】
1.一种语音识别模型训练方法，包括：/n采用多语言样本集对语音识别模型进行预训练得到初始语音识别模型，所述多语言样本集中包括目标语言样本集；/n采用预先训练得到的语言分类器确定目标语言的后验概率；/n根据所述后验概率在基于所述多语言样本集进行训练过程中进行数据加权；/n至少根据数据加权结果训练所述初始语音识别模型；/n采用所述目标语言样本集对训练后的初始语音识别模型进行调整。/n

【技术特征摘要】
1.一种语音识别模型训练方法，包括：
采用多语言样本集对语音识别模型进行预训练得到初始语音识别模型，所述多语言样本集中包括目标语言样本集；
采用预先训练得到的语言分类器确定目标语言的后验概率；
根据所述后验概率在基于所述多语言样本集进行训练过程中进行数据加权；
至少根据数据加权结果训练所述初始语音识别模型；
采用所述目标语言样本集对训练后的初始语音识别模型进行调整。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
对所述多语言样本集中的语料进行对齐处理；
根据对齐处理结果确定所述语料中的每个词在语料中的位置和边界；
根据所述位置和边界对所述语料进行数据增广；
所述至少根据数据加权结果训练所述初始语音识别模型，包括：
根据数据加权结果和数据增广结果训练所述初始化语音识别模型。

3.根据权利要求2所述的方法，其特征在于，根据所述位置和边界对所述语料进行数据增广，包括：根据所述位置和边界对所述语料进行长度扰动处理。

4.根据权利要求2或3所述的方法，其特征在于，所述根据数据加权结果和数据增广结果训练所述初始化语音识别模型，包括：
确定数据加权结果和数据增广结果所对应的新的多语言样本集；
从所述新的多语言样本集中获取第i子部分样本对所述初始化语音识别模型进行第i轮训练；<...

【专利技术属性】
技术研发人员：钱彦旻，周之恺，王巍，卢怡宙，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人