支持多语言混合的语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：29493880 阅读：26 留言：0更新日期：2021-07-30 19:06

本发明专利技术涉及人工智能，提供一种支持多语言混合的语音识别方法，包括：获取训练数据的语音特征；通过至少两个平行网络获取与所述语音特征分别对应的高维特征；对所述平行网络输出的高维特征进行特征拼接，并获取与所述训练数据对应的拼接特征；基于所述拼接特征训练神经网络模型，直至所述神经网络模型收敛至预设范围内，形成语音识别模型；通过所述语音识别模型对待识别的多语言混合信号进行语音识别。本发明专利技术可以提高多语言混合语音的识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
支持多语言混合的语音识别方法、装置、设备及存储介质
本专利技术涉及人工智能领域，尤其涉及一种支持多语言混合的语音识别的方法、装置、设备、电子设备及计算机可读存储介质。
技术介绍
伴随着人工智能技术的发展，越来越多的智能硬件进入人们的生活，而语音输入作为人机交互中最自然、最便捷的方式，逐渐成为主流的交互方式。因此，语音识别的性能直接决定了交互质量的高低。同时，由于全球化的不断深入，不同地区的文化、语言交流日益频繁，人们的语音中经常混合着不同语种，如普通话-英语、粤语-英语、普通话-粤语等。目前的语音识别系统在单一语种的识别任务上具备较好的性能，但在多语种混合识别的场景中还有很大的提升空间。目前，能够实现多语种混合语音识别的技术方案主要包括以下几种：1、基于两套单一语种的声学建模单元，先采用两个支持单一语种的语音识别模型分别对语音进行识别，再结合语种分类器对识别结果进行选取、整合；2、将上述方法中的单一语种识别模型进行合并，进行参数共享，共享后的模型依然具有两个语种的输出，同样使用语种分类器对识别结果进行选取、整合；3、将两套单一语种的声学建模单元进行合并，使用一个统一的识别模型对语音进行识别，不再需要语种分类器，输出结果即为混合语音的识别结果。在上述各方案中，方案1和方案2需要依赖高质量的语种分类器，且计算资源消耗较大，而方案3虽然系统设计简单，计算复杂度较小，但对于语种的区分度不够，尤其对于相近的发音单元，以及在训练语料中时长占比较少的语种，其识别性能普遍较差，导致识别精度低，效果差。...

【技术保护点】
1.一种支持多语言混合的语音识别方法，其特征在于，所述方法包括：/n获取训练数据的语音特征；/n通过至少两个平行网络获取与所述语音特征分别对应的高维特征；/n对所述平行网络输出的高维特征进行特征拼接，并获取与所述训练数据对应的拼接特征；/n基于所述拼接特征训练神经网络模型，直至所述神经网络模型收敛至预设范围内，形成语音识别模型；/n通过所述语音识别模型对待识别的多语言混合信号进行语音识别。/n

【技术特征摘要】
1.一种支持多语言混合的语音识别方法，其特征在于，所述方法包括：
获取训练数据的语音特征；
通过至少两个平行网络获取与所述语音特征分别对应的高维特征；
对所述平行网络输出的高维特征进行特征拼接，并获取与所述训练数据对应的拼接特征；
基于所述拼接特征训练神经网络模型，直至所述神经网络模型收敛至预设范围内，形成语音识别模型；
通过所述语音识别模型对待识别的多语言混合信号进行语音识别。

2.如权利要求1所述的支持多语言混合的语音识别方法，其特征在于，所述获取训练数据的语音特征的步骤包括：
对所述训练数据进行频谱分析，获取与所述训练数据对应的语谱图；
利用预设卷积神经网络对所述语谱图进行特征提取，获取与所述训练数据对应的所述语音特征。

3.如权利要求1所述的支持多语言混合的语音识别方法，其特征在于，所述获取训练数据的语音特征的步骤包括：
预先训练语音特征提取模型；
将所述训练数据输入所述语音特征提取模型，通过所述语音特征提取模型对所述训练数据进行编码，以获取所述训练数据的隐层特征；
对所述隐层特征进行非线性空间映射，获取与所述训练数据对应的所述语音特征。

4.如权利要求3所述的支持多语言混合的语音识别方法，其特征在于，
所述训练数据包括有标注的语音信号数据以及无标注的语音信号数据；
所述有标注的语音信号数据采用数据集或语料库中的标注数据，或者人工、标注模型完成标注的标注数据。

5.如权利要求1所述的支持多语言混合的语音识别方法，其特征在于，所述通过至少两个平行网络获取与所述语音特征分别对应的高维特征的步骤包括：
基于预设的单一语种的语料一，获取与所述语料一对应的语音特征一，基于所述语音特征一训练所述平行网络中的一个网络；同时，
基于预设的另一语种的语料二，获取与所述语料二对应的语音特征二，基于所述语音特征二训练所述平行网络中的另一网络，循环执行上述步骤，直至所有平行网络训练完成；
基于训练完成的平行网络，获取与所述训练数据的语音特征分别对应...

【专利技术属性】
技术研发人员：鄢楷强，魏韬，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人