【技术实现步骤摘要】
一种语音识别方法、装置、设备及计算机可读存储介质
[0001]本申请涉及语音识别
,尤其涉及一种语音识别方法、装置、设备及计算机可读存储介质。
技术介绍
[0002]语音识别技术为将语音信号转变为相应文本的技术。目前的语音识别方案通常为基于语音识别模型的识别方案,在过去的这几年里,基于注意力机制的端到端的语音识别模型引发了广泛的关注,在语音识别任务中,基于注意力机制的端到端的语音识别模型用一个单一的神经网络取代了传统的声学模型、发音模型、语言模型组合,并且能够通过统一目标进行优化。
[0003]基于注意力机制的端到端的语音识别模型虽然得到广泛应用,但也有一些问题随之而来。在问答场景中,用户对一些关键词较为关注,希望根据语音识别模型能够准确识别出语音中的关键词,然而,由于问答场景中的关键词通常为低频词,而训练数据集中包含关键词的训练数据较少,因此,根据训练得到的语音识别模型对问答场景中的语音进行识别时,对于关键词的识别效果不佳。
技术实现思路
[0004]有鉴于此,本申请提供了一种语音识别方法、装 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:根据待识别的目标语音和目标关键词,确定当前解码时刻的第一上下文向量,其中,所述目标语音为针对目标问题的作答语音,所述目标关键词为所述目标问题中包含的关键词,和/或所述目标问题对应的标准答案中包含的关键词;根据所述目标问题和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量;根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果。2.根据权利要求1所述的语音识别方法,其特征在于,所述根据待识别的目标语音以及目标关键词,确定当前解码时刻的第一上下文向量,根据所述目标问题和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量,根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果,包括:利用预先训练得到的语音识别模型处理所述目标语音、所述目标关键词和所述目标问题,得到所述语音识别模型输出的所述目标语音的识别结果,其中,所述语音识别模型采用训练语音、所述训练语音对应的标注文本,同时辅以对应的关键词和问题训练得到。3.根据权利要求2所述的语音识别方法,其特征在于,所述语音识别模型包括:语音编码器、关键词编码器、问题编码器、注意力模块和解码器;所述语音编码器对所述目标语音中各语音帧分别对应的语音特征进行编码,得到所述目标语音中各语音帧分别对应的特征向量;所述关键词编码器对所述目标关键词进行编码,得到所述目标关键词对应的特征向量;所述问题编码器对所述目标问题进行编码,得到所述目标问题对应的特征向量;所述注意力模块根据所述目标语音中各语音帧分别对应的特征向量和所述目标关键词对应的特征向量,确定当前解码时刻的第一上下文向量,根据所述目标问题对应的特征向量和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量;所述解码器根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果。4.根据权利要求3所述的语音识别方法,其特征在于,所述注意力模块根据所述目标语音中各语音帧分别对应的特征向量和所述目标关键词对应的特征向量,确定当前解码时刻的第一上下文向量,包括:所述注意力模块根据所述目标语音中各语音帧分别对应的特征向量、所述目标关键词对应的特征向量以及所述解码器在前一解码时刻的隐层输出向量,确定所述目标语音中各语音帧分别对应的权重;所述注意力模块按所述目标语音中各语音帧分别对应的权重,对所述目标语音中各语音帧分别对应的特征向量加权求和,加权求和后得到的向量作为当前解码时刻的第一上下文向量。5.根据...
【专利技术属性】
技术研发人员:尤祖寰,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。