语音识别纠错方法、装置、电子设备和存储介质制造方法及图纸

技术编号:35910050 阅读:24 留言:0更新日期:2022-12-10 10:49
本发明专利技术提供一种语音识别纠错方法、装置、电子设备和存储介质,其中方法包括:确定待纠错的语音数据的识别文本;基于所述识别文本中各字符在所述语音数据中的对齐位置,确定所述识别文本中各字符对应的声学特征;基于所述识别文本中各字符对应的声学特征和所述识别文本中各字符的语义特征,对所述识别文本进行纠错。本发明专利技术提供的语音识别纠错方法、装置、电子设备和存储介质,不仅仅使用到了识别文本中各字符的语义特征,还使用到了各字符对应的声学特征,相比于相关技术仅考虑语义特征,能够捕获到各字符的声学和语义两方面特征,充分利用多种特征来增强待纠错的识别文本的表示能力,从而提高了错误定位和错误纠正的准确性。从而提高了错误定位和错误纠正的准确性。从而提高了错误定位和错误纠正的准确性。

【技术实现步骤摘要】
语音识别纠错方法、装置、电子设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种语音识别纠错方法、装置、电子设备和存储介质。

技术介绍

[0002]语音识别的准确度对于基于语音的产品和场景非常重要,如语音输入法、会议内容转录、语音情感识别和翻译系统等,目前的语音识别系统均不可避免地存在一些识别错误。因此,一个完善的纠错系统对于整个基于语音场景的应用具有重大意义。
[0003]然而,目前的语音识别纠错方法大多选用文本来建模,将存在错误的文本作为训练数据,能够利用的信息相对受限,导致难以进行准确的错误判定和错误纠正,纠错效果欠佳。

技术实现思路

[0004]本专利技术提供一种语音识别纠错方法、装置、电子设备和存储介质,用以解决现有技术中选用文本建模,导致难以进行准确的错误判定和错误纠正,纠错效果欠佳的缺陷。
[0005]本专利技术提供一种语音识别纠错方法,包括:
[0006]确定待纠错的语音数据的识别文本;
[0007]基于所述识别文本中各字符在所述语音数据中的对齐位置,确定所述识本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别纠错方法,其特征在于,包括:确定待纠错的语音数据的识别文本;基于所述识别文本中各字符在所述语音数据中的对齐位置,确定所述识别文本中各字符对应的声学特征;基于所述识别文本中各字符对应的声学特征和所述识别文本中各字符的语义特征,对所述识别文本进行纠错。2.根据权利要求1所述的语音识别纠错方法,其特征在于,所述基于所述识别文本中各字符对应的声学特征和所述识别文本中各字符的语义特征,对所述识别文本进行纠错,包括:基于所述识别文本中各字符在所述语音数据中的对齐位置,确定所述识别文本中各字符的位置特征;基于所述识别文本中各字符对应的声学特征、所述位置特征以及所述语义特征,对所述识别文本进行纠错。3.根据权利要求2所述的语音识别纠错方法,其特征在于,所述基于所述识别文本中各字符对应的声学特征、所述位置特征以及所述语义特征,对所述识别文本进行纠错,包括:将所述识别文本中各字符的位置特征与所述语义特征进行相加,得到所述识别文本中各字符的位置语义特征;将所述识别文本中各字符的位置语义特征与所述声学特征进行拼接,得到所述识别文本中各字符的拼接特征;基于所述识别文本中各字符的拼接特征,对所述识别文本进行纠错。4.根据权利要求1所述的语音识别纠错方法,其特征在于,所述确定待纠错的语音数据的识别文本,包括:确定语音数据的初始识别文本,并展示所述初始识别文本;将所述初始识别文本和所述语音数据对应的候选识别文本进行对齐,将对齐后的初始识别文本确定为所述待纠错的语音数据的识别文本,并展示所述识别文本;所述基于所述识别文本中各字符对应的声学特征和所述识别文本中各字符的语义特征,对所述识别文本进行纠错,包括:响应于用户对所述识别文本中字符的选取操作,从所述识别文本中确定待纠错字符;基于所述待纠错字符对应的声学特征和所述待纠错字符的语义特征,对所述待纠错字符进行纠错。5.根据权利要求4所述的语音识别纠错方法,其特征在于,还包括:在所述待纠错字符为一个无语义的特殊符号的情况下,基于所述待纠错字符在所述候选识别文本中的对齐位置,对所述待纠错字符进行纠错。6.根据权利要求1

5中任一项所述的语音识别纠错方法,其特征在于,所述基于所述识别文本中各字符在所述语音数据中的对齐位置,确定所述识别文本中各字符对应的声学特征,包括:对所述语音数据进行声学特征提取,得到所述语音数据各语音帧的声学特征;将...

【专利技术属性】
技术研发人员:张文辉万根顺高建清潘嘉刘聪胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1