语音识别处理方法及装置制造方法及图纸

技术编号:38397743 阅读:18 留言:0更新日期:2023-08-07 11:11
本说明书实施例提供了语音识别处理方法及装置,其中,一种语音识别处理方法包括:将待识别语音的语音帧进行语音识别获得的多个候选字符,以及对待识别语音中已识别语音帧的识别输出的历史字符序构成的字符组合与关键字符序列进行匹配,根据匹配结果更新各候选字符的识别概率,并计算各候字符与历史字符序列构成的候选字符序列的识别指标,根据各候选字符序列的识别指标筛选出待识别语音中已识别语音帧的目标字符序列。音帧的目标字符序列。音帧的目标字符序列。

【技术实现步骤摘要】
语音识别处理方法及装置


[0001]本文件涉及数据处理
,尤其涉及一种语音识别处理方法及装置。

技术介绍

[0002]随着网络技术的发展,用户能通过网络参与各种各样的服务,也能通过网络进行各种信息的录入和收集,且随着相关技术的发展,对于不同类型的信息也能进行分析和识别;对于用户产生的语音形式的数据,为了实现后续的处理,需要对语音数据进行识别;
[0003]在对语音数据进行识别的过程中,对于不同的服务场景或者具有特定含义或者解释的词汇,如果识别错误或者出现偏差,会对后续的处理产生较大的影响,如何对语音进行有效识别,成为用户和服务方日益关注的重点。

技术实现思路

[0004]本说明书一个或多个实施例提供了一种语音识别处理方法。所述语音识别处理方法,包括:获取对待识别语音的语音帧进行语音识别获得的多个候选字符,以及各候选字符的识别概率。将所述多个候选字符和历史字符序列构成的字符组合与关键字符序列进行匹配;所述历史字符序列为所述待识别语音中已识别语音帧的识别输出。根据匹配结果更新所述各候选字符的识别概率,并计算所述各候选字本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别处理方法,包括:获取对待识别语音的语音帧进行语音识别获得的多个候选字符,以及各候选字符的识别概率;将所述多个候选字符和历史字符序列构成的字符组合与关键字符序列进行匹配;所述历史字符序列为所述待识别语音中已识别语音帧的识别输出;根据匹配结果更新所述各候选字符的识别概率,并计算所述各候选字符与所述历史字符序列构成的候选字符序列的识别指标;基于所述候选字符序列的识别指标筛选出目标字符序列,作为所述待识别语音中已识别语音帧的识别输出。2.根据权利要求1所述的方法,所述将所述多个候选字符和历史字符序列构成的字符组合与关键字符序列进行匹配,包括:读取所述关键字符序列中与所述历史字符序列匹配的目标关键字符序列,并读取所述目标关键字符序列中所述历史字符序列对应的下一关键字符;将所述多个候选字符中与所述下一关键字符匹配的候选字符确定为目标字符。3.根据权利要求2所述的方法,所述根据匹配结果更新所述各候选字符的识别概率,包括:根据所述目标字符与所述下一关键字符的匹配数量,计算所述目标字符的热度指标;基于所述热度指标对所述多个候选字符中所述目标字符的识别概率进行更新。4.根据权利要求2所述的方法,所述读取所述关键字符序列中与所述历史字符序列匹配的目标关键字符序列,并读取所述目标关键字符序列中所述历史字符序列对应的下一关键字符子步骤执行之后,所述方法还包括:若所述多个候选字符中与所述下一关键字符匹配的目标字符为空,对所述历史字符序列的附加指标进行扣减;其中,所述历史字符序列的附加指标基于组成所述历史字符序列的各字符的热度指标计算获得。5.根据权利要求1所述的方法,所述计算所述各候选字符与所述历史字符序列构成的候选字符序列的识别指标,包括:将所述各候选字符与各历史字符序列进行拼接,获得候选字符序列;基于构成候选字符序列中历史字符序列的识别指标和候选字符的识别概率,计算所述候选字符序列的识别指标。6.根据权利要求1所述的方法,所述基于所述候选字符序列的识别指标筛选出目标字符序列,包括:按照各候选字符序列的识别指标,对候选字符序列进行降序排列,获得字符序列队列;在所述字符序列队列中提取第一阈值对应的位次之前的候选字符序列作为所述目标字符序列。7.根据权利要求1所述的方法,所述获取对待识别语...

【专利技术属性】
技术研发人员:吕安旗王志铭徐陈虹
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1