【技术实现步骤摘要】
语音识别方法、装置、计算机可读介质及电子设备
[0001]本申请属于人工智能
,具体涉及一种语音识别方法、语音识别装置、计算机可读介质以及电子设备。
技术介绍
[0002]随着计算机和网络技术的发展,语音识别技术得到了广泛的普及和应用。基于语音识别技术,计算机可以通过识别和理解过程把语音数据转变为相应的文本数据或者其他类型的数据进行输出,例如可以实现基于语音的文本录入、机器翻译等应用。
[0003]传统的语音识别技术需要训练配合使用的声学模型和语言模型,声学模型可以将语音数据拆分为音素并确定对应的词表,语言模型可以最终将语音数据映射至对应的文字,达到识别语音内容的效果。然而,由于受到训练样本的数量限制,传统的语音识别技术通常只有在指定的场景和领域中才能发挥作用,而在其他未经训练的场景中往往无法进行准确识别,难以获得广泛的适用性。
技术实现思路
[0004]本申请的目的在于提供一种语音识别方法、语音识别装置、计算机可读介质以及电子设备,至少在一定程度上克服相关技术中存在的语音识别准确性低、普遍适用
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获取待识别语音数据以及与所述待识别语音数据相对应的语音参考文本;对所述待识别语音数据进行特征提取得到所述待识别语音数据的语音解码特征,并根据所述语音解码特征预测所述待识别语音数据的第一文本概率分布;对所述语音参考文本进行特征提取得到所述语音参考文本的文本编码特征,并根据所述文本编码特征与所述语音解码特征的相似度预测所述待识别语音数据的第二文本概率分布;对所述第一文本概率分布和所述第二文本概率分布进行融合处理得到所述待识别语音数据的综合文本概率分布;根据所述综合文本概率分布从候选文本中选取作为所述待识别语音数据的语音识别结果的目标文本。2.根据权利要求1所述的语音识别方法,其特征在于,所述对所述第一文本概率分布和所述第二文本概率分布进行融合处理得到所述待识别语音数据的综合文本概率分布,包括:根据所述第二文本概率分布对所述文本编码特征进行加权融合得到所述语音参考文本的融合编码特征;对所述融合编码特征和所述语音解码特征进行映射处理得到用于对所述第一文本概率分布和所述第二文本概率分布进行加权融合的权重系数;根据所述权重系数对所述第一文本概率分布和所述第二文本概率分布进行加权融合得到所述待识别语音数据的综合文本概率分布。3.根据权利要求2所述的语音识别方法,其特征在于,所述对所述融合编码特征和所述语音解码特征进行映射处理得到用于对所述第一文本概率分布和所述第二文本概率分布进行加权融合的权重系数,包括:获取分别与所述融合编码特征和所述语音编码特征相对应的权重分配参数;根据所述权重分配参数对所述融合编码特征和所述语音编码特征进行加权映射得到权重分配特征;对所述权重分配特征进行归一化处理得到用于对所述第一文本概率分布和所述第二文本概率分布进行加权融合的权重系数。4.根据权利要求3所述的语音识别方法,其特征在于,所述获取分别与所述融合编码特征和所述语音编码特征相对应的权重分配参数,包括:对语音数据训练样本进行语音识别处理,以根据语音识别处理结果确定用于表示所述语音数据训练样本的识别准确性的损失误差;根据所述损失误差分别确定所述融合编码特征和所述语音编码特征的误差梯度;根据所述误差梯度确定分别与所述融合编码特征和所述语音编码特征相对应的权重分配参数。5.根据权利要求3所述的语音识别方法,其特征在于,所述获取分别与所述融合编码特征和所述语音编码特征相对应的权重分配参数,包括:获取与所述的待识别语音数据相关的已识别语音数据,并获取用于表示所述已识别语音数据的识别准确性的损失误差;
根据所述损失误差分别确定所述融合编码特征和所述语音编码特征的误差梯度;根据所述误差梯度确定分别与所述融合编码特征和所述语音编码特征相对应的权重分配参数。6.根据权利要求1所述的语音识别方法,其特征在于,所述获取待识别语音数据以及与所述待识别语音数据相对应的语音参考文本,包括:获取待识别语音数据,并确定对所述待识别语音数据进行语音识别的语音识别场景;根据所述语音识别场景从候选文本数据库中选取与所述待识别语音数据相对应的语音参考文本。7.根据权利要求6所述的语音识别方法,其特征在于,所述确定对所述待识别语音数据进行语音识别的语音识别场景,包括:获取用于对所述待识别语音数据进行场景分类的场景分类模型;通过所述场景分类模型对所述待识别语音数据进行特征提取和特征映射处理,以得到所述...
【专利技术属性】
技术研发人员:林炳怀,王丽园,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。