语音识别方法、装置及终端制造方法及图纸

技术编号:33192214 阅读:25 留言:0更新日期:2022-04-24 00:20
本发明专利技术提供一种语音识别方法、装置及终端,解决采用现有语音识别技术进行语音识别错误率高,领域兼容性差的问题。本发明专利技术的方法包括:获取待识别的语音数据,所述待识别的语音数据包括多个领域的语音数据;基于预先构建的第一语音识别模型,对所述待识别的语音数据进行语音识别。本发明专利技术通过获取待识别的语音数据,该待识别的语音数据包括多个领域的语音数据;基于预先构建的第一语音识别模型,对待识别的语音数据进行语音识别,如此,利用具备领域兼容性的第一语音识别模型,能够准确识别不同领域的词语,提升语音识别的准确率。提升语音识别的准确率。提升语音识别的准确率。

【技术实现步骤摘要】
语音识别方法、装置及终端


[0001]本专利技术涉及计算机
,尤其是涉及一种语音识别方法、装置及终端。

技术介绍

[0002]随着人工智能技术的发展,语音识别技术取得了巨大的进步。现有技术中,语音识别主要针对神经网络,而其他网络结构尤其是没有梯度下降的算法无法采用;或者,利用元学习的方法实现对于子任务权重的自动估计,但是元学习的目标是习得一个在新任务上能表现较好的泛化模型,而对于当前任务不一定表现最优;或者只考虑静态样本标注,未考虑每轮迭代过程中对两个领域的识别性能,从而导致采用现有语音识别技术进行语音识别错误率高,领域兼容性差的问题。

技术实现思路

[0003]本专利技术的目的在于提供一种语音识别方法、装置及终端,用于解决采用现有语音识别技术进行语音识别错误率高,领域兼容性差的问题。
[0004]为了达到上述目的,本专利技术提供一种语音识别方法,包括:
[0005]获取待识别的语音数据,所述待识别的语音数据包括多个领域的语音数据;
[0006]基于预先构建的第一语音识别模型,对所述待识别的语音数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获取待识别的语音数据,所述待识别的语音数据包括多个领域的语音数据;基于预先构建的第一语音识别模型,对所述待识别的语音数据进行语音识别。2.根据权利要求1所述的方法,其特征在于,获取待识别的语音数据之前,所述方法还包括:获取第一语料数据,所述第一语料数据包括多个领域的语音数据;基于所述第一语料数据进行模型训练,得到第二语音识别模型;对所述第二语音识别模型进行验证,得到目标领域词语的漏查与误查比;根据所述漏查与误查比,调整所述第二语音识别模型,得到第一语音识别模型。3.根据权利要求2所述的方法,其特征在于,所述目标领域词语的漏查包括:所述目标领域词语被识别为其他领域词语的次数,以及所述目标领域词语未被识别出的次数;所述目标领域词语的误查包括:其他领域词语被识别为所述目标领域词语的次数,以及被多余识别为所述目标领域词语的次数。4.根据权利要求2所述的方法,其特征在于,所述对所述第一语音识别模型进行验证,得到目标领域词语的漏查与误查比,包括:通过验证数据,对所述第二语音识别模型进行验证识别,得到识别结果,所述验证数据为所述第一语料数据中的部分数据;根据所述识别结果,得到目标领域词语的漏查与误查比。5.根据权利要求4所述的方法,其特征在于,所述根据所述识别结果,得到目标领域词语的漏查与误查比,包括:对所述识别结果进行统计,得到所述目标领域词语的漏查和误查;根据所述目标领域词语的漏查和误查,计算得到所述目标领域词语的漏查与误查比。6.根据权利要求2所述的方法,其特征在于,对所述第二语音识别模型进行验证,得到目标领域词语的漏查与误查比之前,所述方法还包括:将所述第一语料数据对应的文本数据,进行分词处理,得到多个词语;对所述多个词语,基于所属领域进行词语筛选,得到对应各个领域的领域词语。7.根据权利要求2所述的方法,其特征在于,所述根据所述漏查与误查比,调整所述第一语音识别模型,包括:在所述漏查与误查比大于1的情况下,升高损失函数中来自目标领域的样本损失的权重系数;在所述漏查与误查比小于1的情况下,降低损失函数中来自目标领域的样本损失的权重系数,所述损失函数为多个领域的样本损失的加权。8.一种语音识别装置,其特征在于,包括:第一获取模块,用于获取待识别的语音数据,所述待识别的语音数据包括多个领域的语音数据;语音识别模块,用于基于预先构建的第一语音识别模型,对所述待识别的语音数据进行语音识...

【专利技术属性】
技术研发人员:高莹莹
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1