语种识别模型的训练方法、语种识别方法及相关设备技术

技术编号：27659047 阅读：21 留言：0更新日期：2021-03-12 14:25

本发明专利技术涉及语音处理技术领域，提供一种语种识别模型的训练方法、语种识别方法及相关设备。所述语种识别模型的训练方法包括：获得样本数据，包括：获得初始语音及其目标语种；对所述初始语音进行预处理，获得语谱图；训练语种识别模型，包括：通过卷积神经网络提取所述语谱图的空间特征；通过循环神经网络提取所述空间特征的时序特征；基于所述时序特征对所述空间特征进行全连接运算，并通过分类器预测语种概率；以及，根据所述语种概率和所述目标语种，调整所述语种识别模型的参数，至所述语种识别模型收敛。本发明专利技术能够对语音的语种做出高效准确的分类，为后续的语音识别提供数据支持。

全部详细技术资料下载

【技术实现步骤摘要】
语种识别模型的训练方法、语种识别方法及相关设备
本专利技术涉及语音处理
，具体地说，涉及一种语种识别模型的训练方法、语种识别方法及相关设备。
技术介绍
随着人工智能技术的发展，语音识别在众多工业场景落地。但是，有的工业场景存在多语种，而目前的语音识别模型只支持单语种。因此在数据源存在多语种的情形下，对语音进行转写之前，需先判别语音的语种，再选择对应语种的语音识别模型进行语音识别。目前的语种判别工作，常通过人工听取声音的音调、音色等进行分辨，效率低，准确性差。需要说明的是，上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此，本专利技术提供一种语种识别模型的训练方法、语种识别方法及相关设备，能够对语音的语种做出高效准确的分类，为后续的语音识别提供数据支持。本专利技术的一个方面提供一种语种识别模型的训练方法，包括：获得样本数据，包括：获得初始语音及其目标语种；对所述初始语音进行预处理，获得语谱图；训练语种识别模型，包括：通过卷积神经网络提取所述语谱图的空间特征；通过循环神经网络提取所述空间特征的时序特征；基于所述时序特征对所述空间特征进行全连接运算，并通过分类器预测语种概率；以及根据所述语种概率和所述目标语种，调整所述语种识别模型的参数，至所述语种识别模型收敛。在一些实施例中，所述的训练方法还包括：提取所述时序特征后，通过注意力机制对所述时序特征进行聚合；对所述空...

【技术保护点】
1.一种语种识别模型的训练方法，其特征在于，包括：/n获得样本数据，包括：/n获得初始语音及其目标语种；/n对所述初始语音进行预处理，获得语谱图；/n训练语种识别模型，包括：/n通过卷积神经网络提取所述语谱图的空间特征；/n通过循环神经网络提取所述空间特征的时序特征；/n基于所述时序特征对所述空间特征进行全连接运算，并通过分类器预测语种概率；以及/n根据所述语种概率和所述目标语种，调整所述语种识别模型的参数，至所述语种识别模型收敛。/n

【技术特征摘要】
1.一种语种识别模型的训练方法，其特征在于，包括：
获得样本数据，包括：
获得初始语音及其目标语种；
对所述初始语音进行预处理，获得语谱图；
训练语种识别模型，包括：
通过卷积神经网络提取所述语谱图的空间特征；
通过循环神经网络提取所述空间特征的时序特征；
基于所述时序特征对所述空间特征进行全连接运算，并通过分类器预测语种概率；以及
根据所述语种概率和所述目标语种，调整所述语种识别模型的参数，至所述语种识别模型收敛。

2.如权利要求1所述的训练方法，其特征在于，还包括：
提取所述时序特征后，通过注意力机制对所述时序特征进行聚合；
对所述空间特征进行全连接运算时，基于聚合后的所述时序特征对所述空间特征进行全连接运算。

3.如权利要求2所述的训练方法，其特征在于，所述通过注意力机制对所述时序特征进行聚合，包括：
获得每个所述时序特征对应的隐向量；
对所述隐向量进行注意力计算，获得上下文向量；以及
根据所述上下文向量，对各所述时序特征进行聚合。

4.如权利要求3所述的训练方法，其特征在于，对所述隐向量进行注意力计算的公式为：
uit＝tanh(Wwhit+bw)；

其中，hit是t时刻所述循环神经网络输出的对应所述时序特征的隐向量，si是经注意力计算获得的i时刻的上下文向量，Ww、bw和uw是参数。

5.如权利要求1所述的训练方法，其特征在于，所述卷积神经网络包括三层，所述循环神经网络包括两层。

6.如权利要求1所述的训练方法，其特征在于，所述对所述初始语音进行预处理，包括：
按帧对所述初始语音进行快速傅里叶变换，获得各帧的频谱；以及
将各帧的所述频谱沿时序拼合成语谱图。

7.一种语种识别方法，其特征在于，包括：
获得待识别语音的有效...

【专利技术属性】
技术研发人员：邓艳江，罗超，胡泓，李巍，
申请(专利权)人：携程计算机技术上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人