口音分类方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:39259529 阅读:23 留言:0更新日期:2023-10-30 12:10
本申请提供了一种口音分类方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,应用于人工智能技术领域,包括:对待分类语音进行口音分类,得到待分类语音中各单位语音归属于各口音类别的概率;对待分类语音进行文本向量提取,得到待分类语音所对应文本的文本向量;其中,单位语音与文本中的单位文本一一对应;基于文本向量,确定文本中各单位文本对应各口音类别的权重;结合各单位文本对应各口音类别的权重,以及各单位语音归属于各口音类别的概率,确定待分类语音归属的目标口音类别。如此,能够提高口音分类结果的精确性。能够提高口音分类结果的精确性。能够提高口音分类结果的精确性。

【技术实现步骤摘要】
口音分类方法、装置、电子设备、存储介质及程序产品


[0001]本申请涉及人工智能
,尤其涉及一种口音分类方法、装置、电子
[0002]设备、计算机可读存储介质以及计算机程序产品。。

技术介绍

[0003]口音是一种地区特有的相对标准发音的变异,例如四川口音、湖南口音或东北口音等,相关技术中,通过对输入音频进行口音分类,从而确定输入音频的口音类型,以为后续的语音识别、区域化广告推广等任务提供口音信息。然而,
[0004]上述口音分类过程仅仅考虑了输入音频本身的特征,而没有考虑到不同口音各
[0005]自的规律和特点,因此,口音分类结果的准确度较低。

技术实现思路

[0006]本申请实施例提供一种口音分类方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,能够提高口音分类结果的精确性。
[0007]本申请实施例的技术方案是这样实现的:
[0008]本申请实施例提供一种口音分类方法,包括:
[0009]对待分类语音进行口音分类,得到所述待分类语音中各单位语音归属于各口音类别本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种口音分类方法,其特征在于,所述方法包括:对待分类语音进行口音分类,得到所述待分类语音中各单位语音归属于各口音类别的概率;对所述待分类语音进行文本向量提取,得到所述待分类语音所对应文本的文本向量;其中,所述单位语音与所述文本中的单位文本一一对应;基于所述文本向量,确定所述文本中各单位文本对应各所述口音类别的权重;结合各单位文本对应各所述口音类别的权重,以及各单位语音归属于各口音类别的概率,确定所述待分类语音归属的目标口音类别。2.如权利要求1所述的方法,其特征在于,所述对待分类语音进行口音分类,得到所述待分类语音中各单位语音归属于各口音类别的概率,包括:对所述待分类语音进行声学向量提取,得到所述待分类语音所对应的声学向量;基于所述声学向量,对待分类语音进行口音分类,得到所述待分类语音中各单位语音归属于各口音类别的概率。3.如权利要求1所述的方法,其特征在于,所述对所述待分类语音进行文本向量提取,得到所述待分类语音所对应文本的文本向量,包括:对所述待分类语音进行识别,得到待分类语音对应的文本;基于所述文本,对所述待分类语音进行文本向量提取,得到所述待分类语音所对应文本中各单位文本的单位文本向量,各单位文本的单位文本向量构成文本向量矩阵;将所述文本向量矩阵作为所述待分类语音所对应文本的文本向量。4.如权利要求1所述的方法,其特征在于,所述方法还包括:获取标准文本,并录制对应所述标准文本的语音,将所述语音作为所述待分类语音;所述对所述待分类语音进行文本向量提取,得到所述待分类语音所对应文本的文本向量,包括:对所述标准文本进行文本向量提取,得到所述标准文本的对齐文本向量,作为所述待分类语音所对应文本的文本向量。5.如权利要求1所述的方法,其特征在于,所述基于所述文本向量,确定所述文本中各单位文本对应各所述口音类别的权重,包括:获取口音权重矩阵,所述口音权重矩阵包括:所述文本对应的字典中,不同单位文本对应各所述口音类别的权重;将所述文本向量与所述口音权重矩阵进行相乘,得到所述文本中各单位文本对应各所述口音类别的权重。6.如权利要求5所述的方法,其特征在于,所述文本向量包括各所述单位文本的单位文本向量,各所述单位文本向量构成文本向量矩阵;所述将所述文本向量与所述口音权重矩阵进行相乘,得到所述文本中各单位文本对应各所述口音类别的权重,包括:对所述文本向量矩阵与所述口音权重矩阵执行矩阵乘,得到二维权重矩阵,所述二维权重矩阵,用于指示各所述单位文本向量对应各所述口音类别的权重;其中,所述二维权重矩阵的第一维度为时间维度,用于指示所述文本向量对应的发音时间,所述二维权重矩阵的第二维度为口音维度,用于指示所述文本中各单位文本对应各
所述口音类别的权重。7.如权利要求1所述的方法,其特征在于,所述结合各单位文本对应各所述口音类别的权重,以及各单位语音归属于各口音类别的概率,确定所述待分类语音归属的目标口音类别,包括:针对所述待分类语音中各单位语音,基于各单位文本对应各所述口音类别的权重,对所述单位语音归属于各口音类别的概率进行加权处理,得到所述单位语音归属于各口音类别的目标概率;基于各单位语音归属于各口音类别的目标概率,确定所述待分类语音归属的目标口音类别。8.如权利要求7所述的方法,其特征在于,所述基于各单位语音归属于各口音类别的目标概率,确定所述待分类语音归属的目标口音类别,包括:将归属于同一口音类别的各单位语音对应的目标概率进行求和处理,得到各所述口音类别对应的目标概率和;从多个所述目标概率和中选择最大目标概率和,并确定所述最大目标概率和对应的口音类别,作为所述待分类语音归属的目标口音类别。9.如权利要求8所述的方法,其特征在于,所述待分类语音的数量为多个,各所述待分类语音所对应的文本不同,多个所述待分类语音构成目标待分类语音,所述从多个所述...

【专利技术属性】
技术研发人员:邵琪杰颜京豪谢磊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1