一种语音处理方法、装置、终端及存储介质制造方法及图纸

技术编号:26381109 阅读:34 留言:0更新日期:2020-11-19 23:49
本申请公开了一种语音处理方法、装置、终端及存储介质,方法包括:获得待识别的目标语音数据;获得所述目标语音数据所属的目标用户;利用所述目标用户对应的语音识别模型,对所述目标语音数据进行语音识别,以得到所述目标语音数据对应的目标文本数据;其中,所述语音识别模型为利用所述目标用户的多个具有文本标签的第一语音样本对通用识别模型进行训练得到,所述通用识别模型为利用多个具有文本标签的第二语音样本对初始构建的通用识别模型进行训练得到。

【技术实现步骤摘要】
一种语音处理方法、装置、终端及存储介质
本申请涉及语音处理
,尤其涉及一种语音处理方法、装置、终端及存储介质。
技术介绍
很多社交软件都有语音转文字的功能。通常情况下,语音转文字后台采用的是同一个语音转文字的语音识别模型。但是由于这个语音识别模型是通用的模型,因此,对不同用户均为同一种转换效果,由此会存在语音转换不准确的情况。
技术实现思路
有鉴于此,本申请提供一种语音处理方法、装置、终端及存储介质,以提高对语音处理的准确性。为实现上述目的,一方面,本申请提供了一种语音处理方法,包括:获得待识别的目标语音数据;获得所述目标语音数据所属的目标用户;利用所述目标用户对应的语音识别模型,对所述目标语音数据进行语音识别,以得到所述目标语音数据对应的目标文本数据;其中,所述语音识别模型为利用所述目标用户的多个具有文本标签的第一语音样本对通用识别模型进行训练得到,所述通用识别模型为利用多个具有文本标签的第二语音样本对初始构建的通用识别模型进行训练得到。在一种可能的实现方式中,本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:/n获得待识别的目标语音数据;/n获得所述目标语音数据所属的目标用户;/n利用所述目标用户对应的语音识别模型,对所述目标语音数据进行语音识别,以得到所述目标语音数据对应的目标文本数据;/n其中,所述语音识别模型为利用所述目标用户的多个具有文本标签的第一语音样本对通用识别模型进行训练得到,所述通用识别模型为利用多个具有文本标签的第二语音样本对初始构建的通用识别模型进行训练得到。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:
获得待识别的目标语音数据;
获得所述目标语音数据所属的目标用户;
利用所述目标用户对应的语音识别模型,对所述目标语音数据进行语音识别,以得到所述目标语音数据对应的目标文本数据;
其中,所述语音识别模型为利用所述目标用户的多个具有文本标签的第一语音样本对通用识别模型进行训练得到,所述通用识别模型为利用多个具有文本标签的第二语音样本对初始构建的通用识别模型进行训练得到。


2.根据权利要求1所述的方法,其特征在于,获得所述目标语音数据所属的目标用户,包括:
获得第一语音集合中预设的每个第一语音数据,每个所述第一语音数据分别对应于一个所属用户;
利用用户分类模型,对所述目标语音数据和所述第一语音数据进行语音处理,以得到所述目标语音数据所属的目标用户,所述目标用户对应的第一语音数据与所述目标语音数据满足预设的相似条件;
其中,所述用户分类模型为利用多个具有用户分类标签的语音样本组对初始构建的用户分类模型进行训练得到,所述语音样本组包含两个第三语音样本,所述用户分类标签表征所述语音样本组中的两个所述第三语音样本是否属于同一用户。


3.根据权利要求2所述的方法,其特征在于,所述目标用户对应的第一语音数据与所述目标语音数据满足预设的相似条件,包括:
所述目标用户对应的第一语音数据与所述目标语音数据之间的相似度大于或等于预设的相似阈值;
和/或,
所述目标用户对应的第一语音数据与所述目标语音数据之间的相似度最大。


4.根据权利要求2所述的方法,其特征在于,所述用户分类模型中至少包含卷积神经网络层、全联通层和分类层;
其中,所述卷积神经网络层用于对所述目标语音数据和所述第一语音数据分别进行语音特征提取,以得到所述目标语音数据对应的第一语音特征和所述第一语音数据对应的第二语音特征;
所述全联通层用于对所述第一语音特征和所述第二语音特征进行特征交互处理,以得到特征交互结果;
所述分类层用于根据所述特征交互结果,生成分类结果,所述分类结果表征所述目标语音数据和所述第一语音数据是否属于同一用户。


5.根据权利要求2所述的方法,其特征在于,获得第一语音集...

【专利技术属性】
技术研发人员:田植良
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1