一种基于声学模型和语言模型的音频识别方法技术

技术编号:32640268 阅读:42 留言:0更新日期:2022-03-12 18:16
本申请提供了一种基于声学模型和语言模型的音频识别方法。本方法包括:获取音频片段;基于声学模型对音频片段进行处理,得到音频片段对应的音素序列,音素序列包括用于表征标点符号的标点音素;基于语言模型对音素序列进行处理,得到音素序列对应的文本信息,文本信息包括标点符号。本方法无需引入其他的标点模块和搜索模块对纯文本信息进行处理,通过声学模型和语言模型可以直接得到音频片段对应的带有标点符号的文本信息,使得音频识别更加方便和高效。和高效。和高效。

【技术实现步骤摘要】
一种基于声学模型和语言模型的音频识别方法


[0001]本申请涉及音频信号处理领域,更具体地,涉及一种基于声学模型和语言模型的音频识别方法。

技术介绍

[0002]在现有的音频识别技术中,通过音频识别模型只能将音频片段转换成纯文本信息,即不包括标点符号的文本信息。
[0003]进一步地,若需要在纯文本信息中添加标点符号,需要进一步引入标点模块以及标点路径的搜索模块对纯文本信息进行处理。因此,在现有技术中,无法通过单一的音频识别模型直接得到带有标点符号的文本信息。

技术实现思路

[0004]本申请实施例提供一种基于声学模型和语言模型的音频识别方法。
[0005]第一方面,本申请一些实施例提供一种基于声学模型和语言模型的音频识别方法,该方法包括:获取音频片段。基于声学模型对音频片段进行处理,得到音频片段对应的音素序列。其中,音素序列包括用于表征标点符号的标点音素,声学模型是通过第一训练音频片段对初始声学模型训练得到的,第一训练音频片段标注有第一训练音素序列,第一训练音素序列包括第一训练标点音素。基于语言模型对音素序列进本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于声学模型和语言模型的音频识别方法,其特征在于,所述方法包括:获取音频片段;基于声学模型对所述音频片段进行处理,得到所述音频片段对应的音素序列,所述音素序列包括用于表征标点符号的标点音素,所述声学模型是通过第一训练音频片段对初始声学模型训练得到的,所述第一训练音频片段标注有第一训练音素序列,所述第一训练音素序列包括第一训练标点音素;基于语言模型对所述音素序列进行处理,得到所述音素序列对应的文本信息,所述文本信息包括标点符号,所述语言模型是通过第二训练音素序列对初始语言模型训练得到的,所述第二训练音素序列标注有第一训练文本信息,所述第二训练音素序列包括第二训练标点音素,所述第一训练文本信息包括训练标点符号。2.根据权利要求1所述的方法,其特征在于,所述基于语言模型对所述音素序列进行处理,得到所述音素序列对应的文本信息,包括:基于所述语言模型对所述音素序列进行处理,得到至少一个候选文本的候选概率,所述候选概率表征所述候选文本为所述音素序列对应的文本信息的概率;将最大候选概率对应的候选文本确定为所述音素序列对应的文本信息。3.根据权利要求2所述的方法,其特征在于,所述候选文本包括至少一个候选文字和至少一个候选标点符号,所述候选文字对应有文字候选概率,所述候选标点符号对应有标点符号候选概率;所述基于所述语言模型对所述音素序列进行处理,得到至少一个候选文本的候选概率,包括:基于所述语言模型对所述音素序列进行处理,得到至少一个候选文本对应的至少一个所述文字候选概率;基于所述语言模型对所述音素序列进行处理,得到至少一个候选文本对应的至少一个所述标点符号候选概率;将至少一个所述文字候选概率和至少一个所述标点符号候选概率的乘积确定为至少一个候选文本的候选概率。4.根据权利要求3所述的方法,其特征在于,所述基于所述语言模型对所述音素序列进行处理,得到至少一个候选文本对应的至少一个所述文字候选概率之后,还包括:检测所述候选文本中的目标词语是否存在于热词库中;若所述候选文本中的目标词语存在于所述热词库中,则对所述目标词语对应的文字候选概率进行更新,更新后的所述目标词语对应的文字候选概率大于更新前的所述目标词语对应的文字候选概率。5.根据权利要求4所述的方法,其特征在于,所述若所述候选文本中的目标词语存在于所述热词库中,则对所述目标词语对应的文字候选概率进行更新,包括:将所述目标词语对应的文字候选概率和第一映射因子之间的乘积,确定为所述更新后的所述目标词语对应的文字候选概率,所述第一映射因子大于一。6.根据权利要求3所述的方法,其特征在于,所述基于所述语言模型对所述音素序列进行处理,得到至少一个候选文本...

【专利技术属性】
技术研发人员:吴广财赖蔚蔚郑颖龙叶杭周昉昉陈颖璇郑杰生李雪武林嘉鑫黄宏恩
申请(专利权)人:广东电力信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1