【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质
[0001]本申请涉及语音处理
,更具体地说,涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
[0002]目前的端到端的语音识别模型的领域适用性较差,主要表现是语音识别模型只在与训练集匹配的测试集上准确率较高,一旦测试集领域和训练集不同,如训练集是金融领域,测试集是医疗领域,则语音识别模型的准确率会大幅降低。因此,如何提高语音识别模型的领域适用性成为亟待解决的技术问题。
技术实现思路
[0003]有鉴于此,本申请提供了一种语音识别方法、装置、设备及存储介质,以提高语音识别模型的领域适用性。
[0004]为了实现上述目的,现提出的方案如下:
[0005]一种语音识别方法,包括:
[0006]获得待识别语音的当前时刻的各个可能的解码结果的声学分数,以及当前时刻所述各个可能的解码结果在多个领域中的每一个领域的语言分数;
[0007]利用当前时刻所述各个可能的解码结果的声学分数和各个领域的语言分数,获得当前时刻所述各个可能的解码结果在每 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获得待识别语音的当前时刻的各个可能的解码结果的声学分数,以及当前时刻所述各个可能的解码结果在多个领域中的每一个领域的语言分数;利用当前时刻所述各个可能的解码结果的声学分数和各个领域的语言分数,获得当前时刻所述各个可能的解码结果在每一个领域的语言分数的权重;其中,与所述各个可能的解码结果的声学分数越接近,所述各个可能的解码结果的语言分数的权重越大;根据当前时刻所述各个可能的解码结果在所述多个领域的语言分数的加权求和结果,以及所述当前时刻各个可能的解码结果的声学分数,确定当前时刻的解码结果。2.根据权利要求1所述的方法,其特征在于,所述利用当前时刻所述各个可能的解码结果的声学分数和各个领域的语言分数,获得当前时刻所述各个可能的解码结果在每一个领域的语言分数的权重,包括:对应每一个领域,将当前时刻所述各个可能的解码结果的声学分数和同一可能的解码结果在该领域的语言分数求和,得到当前时刻所述各个可能的解码结果对应的分数和值;根据预置的所述各个可能的解码结果的权值,将所述当前时刻各个可能的解码结果对应的分数和值加权求和,得到该领域的语言分数的权重。3.根据权利要求1所述的方法,其特征在于,所述获得待识别语音的当前时刻的各个可能的解码结果的声学分数,以及当前时刻所述各个可能的解码结果在多个领域中的每一个领域的语言分数,包括:获得对所述待识别语音的各个语音帧进行编码得到的帧编码结果,以及多个领域的语言模型分别对前一时刻的解码结果进行处理得到的隐层特征;至少利用所述帧编码结果和第一领域的语言模型得到的隐层特征,获得当前时刻所述各个可能的解码结果的声学分数;其中,用于对待识别语音的各个语音帧进行编码得到的所述帧编码结果的编码器与所述第一领域的语言模型通过所述第一领域的语音训练数据联合训练得到;对每一个领域的语言模型得到的隐层特征分别进行处理,得到当前时刻所述各个可能的解码结果在每一个领域的语言分数。4.根据权利要求3所述的方法,其特征在于,所述至少利用所述帧编码结果和第一领域的语言模型得到的隐层特征,获得当前时刻所述各个可能的解码结果的声学分数,包括:对所述帧编码结果和所述第一领域的语言模型得到的隐层特征进行基于注意力机制的处理,获得当前时刻各个语音帧的关注度;根据所述当前时刻各个语音帧的关注度获得当前时刻所述各个可能的解码结果的声学分数。5.根据权利要求3所述的方法,其特征在于,所述至少利用所述帧编码结果和第一领域的语言模型得到的隐层特征,获得当前时刻所述各个可能的解码结果的声学分数,包括:利用所述帧编码结果、所述第一领域的语言模型得到的隐层特征、前一时刻的各个语音帧...
【专利技术属性】
技术研发人员:王孟之,万根顺,高建清,刘聪,王智国,胡国平,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。