语音识别方法、电子设备、存储介质及计算机程序产品技术

技术编号:41978342 阅读:20 留言:0更新日期:2024-07-12 12:10
本公开提供了一种语音识别方法,包括:对语音数据的候选字符集进行解码,生成对应于语音数据的多个表意单元;响应于任一表意单元与专用词典之间具有映射关系,在专用词典中调取表意单元的至少两个关联词;结合多个表意单元所表征的语义环境,分别计算各个关联词的匹配概率值,将具有最大匹配概率值的关联词作为表意单元的词汇文本。本公开还提供一种电子设备、存储介质及计算机程序产品。

【技术实现步骤摘要】

本公开涉及音频处理领域,特别涉及一种语音识别方法、电子设备、存储介质及计算机程序产品


技术介绍

1、语音识别是将音频形式的数据进行文本形式转换的过程,语音识别技术依托于包含声学模型和语言模型的语音识别系统。在传统的语音识别过程,声学模型负责将音频数据解析为音素序列,为语言模型提供文本转换基础;语言模型则根据这些音素序列进行文字或者字母的映射,以形成对应于音频数据的字符序列。声学模型和语言模型在训练时并不需要耦合,均可独立训练。

2、但是,传统的语音识别系统的缺点在于,语音识别的过程依赖于发音字典,需要发音字段中的音素标注。并且,对于训练语料的更迭扩充,传统语音识别系统会达到瓶颈,识别准确度受限。虽然,目前端到端模型可以克服传统语音识别系统的缺点,直接将音频数据转换为字符序列,避免了两种独立模块的配合。但是,端到端的语音识别技术是以“字”为建模单元的,训练语料一般是通用语料,缺少生僻字或者专有名词(包含多个字)的训练,那么在识别过程中遇到这些情况,则会出现识别错误的问题,影响用户体验。


技术实现思

<本文档来自技高网...

【技术保护点】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的语音识别方法,其特征在于,在所述响应于任一所述表意单元与专用词典之间具有映射关系,在所述专用词典中调取所述表意单元的至少两个关联词之前,包括:

3.根据权利要求2所述的语音识别方法,其特征在于,所述将各个所述表意单元分别与目标解码器中的所述专用词典进行映射,筛选出具有所述映射关系的所述表意单元,包括:

4.根据权利要求2或3所述的语音识别方法,其特征在于,在所述将各个所述表意单元分别与所述专用词典进行映射,筛选出具有所述映射关系的所述表意单元之前,包括:

5.根据权利要求4所...

【技术特征摘要】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的语音识别方法,其特征在于,在所述响应于任一所述表意单元与专用词典之间具有映射关系,在所述专用词典中调取所述表意单元的至少两个关联词之前,包括:

3.根据权利要求2所述的语音识别方法,其特征在于,所述将各个所述表意单元分别与目标解码器中的所述专用词典进行映射,筛选出具有所述映射关系的所述表意单元,包括:

4.根据权利要求2或3所述的语音识别方法,其特征在于,在所述将各个所述表意单元分别与所述专用词典进行映射,筛选出具有所述映射关系的所述表意单元之前,包括:

5.根据权利要求4所述的语音识别方法,其特征在于,在所述结合多个所述表意单元所表征的语义环境,分别计算各个所述关联词的匹配概率值,将具有最大所述匹配概率值的所述关联词作为所述表意单元的词...

【专利技术属性】
技术研发人员:魏光辉李志飞
申请(专利权)人:出门问问苏州信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1