语种识别方法、相关设备及可读存储介质技术

技术编号:25805963 阅读:89 留言:0更新日期:2020-09-29 18:40
本申请公开了一种语种识别方法、相关设备及可读存储介质,在获取待识别的语音数据之后,确定该语音数据的语种特征;利用预先建立的第一语种识别模型对该语音数据的语种特征进行第一次识别,得到第一次语种识别结果;当第一次语种识别结果不准确时,利用预先建立的第二语种识别模型对该语音数据的语种特征进行第二次识别,得到第二次语种识别结果,并基于第一次语种识别结果和第二次语种识别结果,确定该语音数据的语种。上述方案中,如果第一次语种识别结果不准确,可以利用比第一语种识别模型的网络层数多的第二语种识别模型进行第二次识别,从而提升识别准确率。

【技术实现步骤摘要】
语种识别方法、相关设备及可读存储介质
本申请涉及自然语言处理
,更具体的说,是涉及一种语种识别方法、相关设备及可读存储介质。
技术介绍
语种识别是计算机分析处理一个语音数据判别其所属语言种类的过程,是语音识别的一个重要研究方向。随着全球化进程的不断加快,语种识别在多语种信息服务、机器翻译及军事安全等领域都有广泛的应用前景。现有技术中,多采用诸如混合高斯模型(英文全称:GaussianMixtureModel,英文简称:GMM)、支持向量机(英文全称:SupportVectorMachine,英文简称:SVM)、高斯混合模型超矢量-支持向量机(英文全称:GaussianSuperVector-SupportVectorMachine,英文简称:GSV-SVM)的语种识别方法对语音进行语种识别。但是,现有技术中,对语音数据进行语种识别的方法,得到的语种识别结果准确率并不理想。因此,对现有技术中的语种识别方法进行优化显得尤为必要。
技术实现思路
鉴于上述问题,本申请提出了一种语种识别方法、相关设备及可读存储介本文档来自技高网...

【技术保护点】
1.一种语种识别方法,其特征在于,包括:/n获取待识别的语音数据;/n确定所述语音数据的语种特征;/n利用预先建立的第一语种识别模型对所述语音数据的语种特征进行第一次识别,得到第一次语种识别结果;/n当所述第一次语种识别结果不准确时,利用预先建立的第二语种识别模型对所述语音数据的语种特征进行第二次识别,得到第二次语种识别结果;基于所述第一次语种识别结果和所述第二次语种识别结果,确定所述语音数据的语种;所述第二语种识别模型的网络层数多于所述第一语种识别模型。/n

【技术特征摘要】
1.一种语种识别方法,其特征在于,包括:
获取待识别的语音数据;
确定所述语音数据的语种特征;
利用预先建立的第一语种识别模型对所述语音数据的语种特征进行第一次识别,得到第一次语种识别结果;
当所述第一次语种识别结果不准确时,利用预先建立的第二语种识别模型对所述语音数据的语种特征进行第二次识别,得到第二次语种识别结果;基于所述第一次语种识别结果和所述第二次语种识别结果,确定所述语音数据的语种;所述第二语种识别模型的网络层数多于所述第一语种识别模型。


2.根据权利要求1所述的方法,其特征在于,所述确定所述语音数据的语种特征,包括:
获取所述语音数据的声学特征;
利用预先建立的语种特征提取模型的特征变换模块对所述语音数据的声学特征进行特征转换,得到变换后的特征;
利用所述语种特征提取模型的时序特征提取模块,从所述变换后的特征中提取时序特征;
利用所述语种特征提取模型的语种特征提取模块,从所述时序特征中提取所述语音数据的语种特征。


3.根据权利要求2所述的方法,其特征在于,所述语种特征提取模型的训练过程,包括:
获取训练语音数据;
确定每个训练语音数据的声学特征,以及,每个训练语音数据的音素信息;
以每个训练语音数据的声学特征为训练样本,以所述训练语音数据的音素信息为样本标签,训练得到音素识别模型;
去除所述音素识别模型的输出层,得到所述语种特征提取模型。


4.根据权利要求1所述的方法,其特征在于,所述利用预先建立的第一语种识别模型对所述语音数据的语种特征进行第一次识别,得到第一次语种识别结果,包括:
利用所述第一语种识别模型的均值超矢量特征提取模块,对所述语音数据的语种特征进行处理,得到所述语种特征的均值超矢量特征;
利用所述第一语种识别模型的语种识别模块,对所述语种特征的均值超矢量特征进行识别,得到第一次语种识别结果。


5.根据权利要求4所述的方法,其特征在于,所述第一语种识别模型的训练过程,包括:
获取至少一个语种对应的训练语音数据集;
对每个语种对应的训练语音数据集进行标注,得到每个语种对应的训练语音数据集的标注结果,每个语种对应的训练语音数据的标注结果用于指示所述语种对应的训练语音数据集的语种;
确定各个语种对应的训练语音数...

【专利技术属性】
技术研发人员:杨军方磊方四安唐磊
申请(专利权)人:合肥讯飞数码科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1