一种语种识别方法、装置、设备、介质及产品制造方法及图纸

技术编号:42976639 阅读:19 留言:0更新日期:2024-10-15 13:14
本申请提供一种语种识别方法、装置、设备、介质及产品,该方法包括:对待识别的语音数据进行语种识别,得到语音数据对应的初始语种识别结果,初始语种识别结果包括语音数据的各个语音帧各自对应的帧级别语种识别结果;基于初始语种识别结果,确定语音数据对应的中间语种识别结果,中间语种识别结果包括语音数据中的各个语种片段;基于中间语种识别结果中的各个语种片段各自对应的帧级别语种识别结果,对各个语种片段进行合并,得到语音数据对应的语种识别结果。本申请可以提高对混合语种数据的语种识别的准确度。

【技术实现步骤摘要】

本申请涉及人工智能领域,尤其涉及一种语种识别方法、装置、设备、介质及产品


技术介绍

1、语种识别是指根据输入的语音数据,自动识别出说话人所使用的语种类别。

2、目前,主流的语种识别方法为利用训练语料,训练一个语种识别的分类网络。之后,利用该分类网络对待测语音进行语种识别,其对于单一语种的待测语音进行语种识别时,具有较好的识别效果。然而,当一条待测语音中包括多个语种类别时,当前的分类网络的语种识别准确度较低,甚至无法正常运行。


技术实现思路

1、基于上述技术现状,本申请提供一种语种识别方法、装置、设备、介质及产品。

2、为了达到上述技术目的,本申请具体提出如下技术方案:

3、根据本申请实施例的第一方面,提供了一种语种识别方法,包括:对待识别的语音数据进行语种识别,得到所述语音数据对应的初始语种识别结果,所述初始语种识别结果包括所述语音数据的各个语音帧各自对应的帧级别语种识别结果;基于所述初始语种识别结果,确定所述语音数据对应的中间语种识别结果,所述中间语种识别结果包括所述语本文档来自技高网...

【技术保护点】

1.一种语种识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述初始语种识别结果,确定所述语音数据对应的中间语种识别结果,包括:

3.根据权利要求2所述的方法,其特征在于,基于该中间语种识别结果中各个语种片段各自对应的帧级别语种识别结果,对各个语种片段进行合并,得到该中间语种识别结果对应的候选语种识别结果,包括:

4.根据权利要求3所述的方法,其特征在于,每个语音帧对应的帧级别语种识别结果包括将该语音帧被识别为各个语种类别的识别概率;

5.根据权利要求3所述的方法,其特征在于,所述基于所述第一评分和所述第二评...

【技术特征摘要】

1.一种语种识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述初始语种识别结果,确定所述语音数据对应的中间语种识别结果,包括:

3.根据权利要求2所述的方法,其特征在于,基于该中间语种识别结果中各个语种片段各自对应的帧级别语种识别结果,对各个语种片段进行合并,得到该中间语种识别结果对应的候选语种识别结果,包括:

4.根据权利要求3所述的方法,其特征在于,每个语音帧对应的帧级别语种识别结果包括将该语音帧被识别为各个语种类别的识别概率;

5.根据权利要求3所述的方法,其特征在于,所述基于所述第一评分和所述第二评分,对所述第t个语种片段、所述第t-1个语种片段和第t+1个语种片段进行合并,包括:

6.根据权利要求2所述的方法,其特征在于,基于该中间语种识别结果中各个语种片段各自对应的帧级别语种识别结果,对各个语种片段进行合并,得到该中间语种识别结果对应的候选语种识别结果,包括:

7.根据权利要求6所述的方法,其特征在于,每个语音帧对应的帧级别语种识别结果包括将该语音帧分别识别为多个语种类别的概率;

8.根据权利要求6所述的方法,其特征在于,所述基于所述第三评分和所述第四评分,对所述第t个语种片段、所述第t-1个语种片段和第t+1个语种片段进行合并,包括:

9.根据权利要求5或8所述的方法,其特征在于,所述得到一次更新的第t-1个语种片段之后,所述方法还包括:

10.根据权利要求2所述的方法,其特征在于...

【专利技术属性】
技术研发人员:杨军方磊桑宏报夏翔宣璇周振昆方四安柳林
申请(专利权)人:合肥讯飞数码科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1