一种语音识别方法、装置、设备、程序产品及存储介质制造方法及图纸

技术编号:43571753 阅读:25 留言:0更新日期:2024-12-06 17:40
本申请提供了语音识别方法,包括:获取初始热词列表中至少一个热词的第一键向量和第一值向量,获取待识别语音信息,对待识别语音信息进行编码,得到待识别语音信息的隐层输出向量;基于注意力机制,利用隐层输出向量、第一键向量和第一值向量对初始热词列表进行过滤,得到目标热词列表;获取目标热词列表中至少一个目标热词的第二键向量和第二值向量;对第二键向量、第二值向量和隐层输出向量进行解码,得到待识别语音信息对应的语音识别结果,其中,语音识别结果包括目标热词列表中的至少一个目标热词。本申请还提供了语音识别装置、电子设备计算机程序产品及存储介质,本申请能够对语音信息中的热词进行准确识别。

【技术实现步骤摘要】

本申请涉及语音信息处理技术,尤其涉及语音识别方法、装置、电子设备、计算机程序产品及存储介质。


技术介绍

1、随着机器学习技术的发展,机器学习可以通过bert(bidirectional encoderrepresentations from transformers,源于transformers的双向编码器)机制实现,在使用bert对应的语音识别模型对语音数据进行识别的过程中,随着语言使用环境的发展和变化,语音识别模型的训练时所使用的语料对应的场景很可能与实际场景不一致,且实际场景可能包含训练语料中未出现或出现极少的词汇,因此,相关技术中的语音识别模型对于语音信息中的热词无法识别或者进行错误识别,造成语音识别系统的实际使用效果变差,影响用户的正常使用。


技术实现思路

1、有鉴于此,本申请实施例提供一种语音识别方法、装置、电子设备、计算机程序产品及存储介质,本申请实施例的技术方案是这样实现的:

2、本申请实施例提供了一种语音识别方法,所述方法包括:

3、获取初始热词列表中至少一个热词的第本文档来自技高网...

【技术保护点】

1.一种语音识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于注意力机制,利用所述隐层输出向量、所述第一键向量和所述第一值向量对所述初始热词列表进行过滤,得到目标热词列表,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述至少一个目标热词的值向量对所述初始热词列表进行过滤,得到所述目标热词列表,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述第二键向量、所述第二值向量和所述隐层输出向量进行解码,得到所述待识别语音信息对应的语音识别结果,包括:

5.根据权利要求4所述的方法,其特征在于...

【技术特征摘要】

1.一种语音识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于注意力机制,利用所述隐层输出向量、所述第一键向量和所述第一值向量对所述初始热词列表进行过滤,得到目标热词列表,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述至少一个目标热词的值向量对所述初始热词列表进行过滤,得到所述目标热词列表,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述第二键向量、所述第二值向量和所述隐层输出向量进行解码,得到所述待识别语音信息对应的语音识别结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述语音识别模型的解码器网络包括:热词导入模块和至少一个解码模块;

6.根据权利要求5所述的方法,其...

【专利技术属性】
技术研发人员:汤志远黄申商世东
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1