语音纠错方法、装置、设备及存储介质制造方法及图纸

技术编号:37982022 阅读:12 留言:0更新日期:2023-06-30 09:57
本发明专利技术属于智能交互技术领域,公开了一种语音纠错方法、装置、设备及存储介质。本发明专利技术通过在检测到语音信息存在错误时,确定语音信息中的待纠错字符,获取待纠错字符对应的待纠错音节,根据预设替换策略确定待纠错音节中的待替换音素以及待替换音素对应的目标音素,将待替换音素替换为目标音素,获得目标音节,并根据目标音节对待纠错字符进行纠错,获得纠错后的语音信息。由于本发明专利技术通过确定语音信息中的待纠错音节,根据预设替换策略确定待纠错音节中的待替换音素以及待替换音素对应的目标音素,然后根据对待替换音素进行替换,实现了对语音信息中错误字符的待纠错音节进行纠错,从而使语音信息的错误得到快速修正,提升了语音纠错效率。纠错效率。纠错效率。

【技术实现步骤摘要】
语音纠错方法、装置、设备及存储介质


[0001]本专利技术涉及智能交互
,尤其涉及一种语音纠错方法、装置、设备及存储介质。

技术介绍

[0002]随着科学技术的发展和社会的进步,智能交互越来越普及,而在智能交互普及的过程中,与之关系密切的语音识别技术(ASR)也逐渐走进人们的工作和生活中。在智能交互场景中往往会使用到语音识别技术,然而语音识别存在一定的错误识别几率。在中文应用场景下,最常见的语音识别错误为拼音错误,目前对中文拼音的纠错方式是直接识别语音信息的拼音组成,然后计算该拼音的纠错编辑距离,根据纠错编辑距离直接对该语音信息进行纠错,现有的拼音纠错方式的纠错编辑距离较长,导致纠错效率低以及纠错时间长的问题。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种语音纠错方法、装置、设备及存储介质,旨在解决现有技术语音纠错效率低以及纠错时间长的技术问题。
[0005]为实现上述目的,本专利技术提供了一种语音纠错方法,所述方法包括以下步骤:
[0006]在检测到语音信息存在错误时,确定所述语音信息中的待纠错字符;
[0007]获取所述待纠错字符对应的待纠错音节;
[0008]根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素;
[0009]将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息。
[0010]可选地,所述根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素,包括:
[0011]根据预设替换策略对所述待纠错音节中的各音素进行音素匹配;
[0012]根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素。
[0013]可选地,所述根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素,包括:
[0014]在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素;
[0015]根据预设替换映射表确定所述待替换音素对应的目标音素。
[0016]可选地,所述在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素,包括:
[0017]在音素匹配成功时,根据匹配结果确定所述待纠错音节对应的音素组成类型;
[0018]根据所述音素组成类型确定所述待纠错音节中的待替换音素。
[0019]可选地,所述根据预设替换策略对所述待纠错音节中的各音素进行音素匹配之后,所述方法还包括:
[0020]在音素匹配失败时,确定所述待纠错音节对应的音素组成类型;
[0021]根据所述音素组成类型判断所述待纠错音节中是否存在需要删除的音素;
[0022]若存在,则删除所述需要删除的音素,获得修改后的音节。
[0023]可选地,所述若存在,则删除所述需要删除的音素,获得修改后的音节之后,所述方法包括:
[0024]根据所述音素组成类型确定所述修改后的音节中的待替换音素以及所述待替换音素对应的目标音素。
[0025]可选地,所述根据所述音素组成类型确定所述修改后的音节中的待替换音素以及所述待替换音素对应的目标音素,包括:
[0026]根据所述音素组成类型确定所述修改后的音节中的待替换音素;
[0027]根据预设替换映射表确定所述待替换音素对应的目标音素。
[0028]可选地,所述根据所述音素组成类型判断所述待纠错音节中是否存在需要删除的音素之后,所述方法还包括:
[0029]若不存在,则根据所述音素组成类型确定所待纠错音节中的待替换音素;
[0030]根据所述预设替换映射表确定所述待替换音素对应的目标音素。
[0031]可选地,所述将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息,包括:
[0032]将所述待替换音素替换为所述目标音素,获得目标音节;
[0033]根据预设纠错策略对所述目标音节进行纠错,并将纠错后的音节转换为对应的目标字符;
[0034]将待纠错字符替换为所述目标字符,获得纠错后的语音信息。
[0035]可选地,所述根据预设纠错策略对所述目标音节进行纠错,并将纠错后的音节转换为对应的目标字符,包括:
[0036]根据预设纠错策略确定所述目标音节的纠错编辑距离;
[0037]根据所述纠错编辑距离对所述目标音节进行纠错;
[0038]将纠错后的音节转换为对应的目标字符。
[0039]可选地,所述根据预设纠错策略确定所述目标音节的纠错编辑距离之后,所述方法包括:
[0040]获取标准纠错策略,根据所述标准纠错策略确定所述目标音节的标准编辑距离;
[0041]在所述纠错编辑距离未超过所述标准编辑距离时,执行所述根据所述纠错编辑距离对所述目标音节进行纠错的步骤。
[0042]可选地,所述获取标准纠错策略,根据所述标准纠错策略确定所述目标音节的标准编辑距离之后,所述方法还包括:
[0043]在所述纠错编辑距离超过所述标准编辑距离时,根据所述标准编辑距离对所述目标音节进行纠错;
[0044]执行所述将纠错后的音节转换为对应的目标字符的步骤。
[0045]此外,为实现上述目的,本专利技术还提出一种语音纠错装置,所述语音纠错装置包括:
[0046]音节获取模块,用于获取所述待纠错字符对应的待纠错音节;
[0047]替换策略模块,用于根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素;
[0048]替换纠错模块,用于将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息。
[0049]进一步地,所述替换纠错模块,还用于根据预设替换策略对所述待纠错音节中的各音素进行音素匹配,根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素。
[0050]进一步地,所述替换纠错模块,还用于在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素,根据预设替换映射表确定所述待替换音素对应的目标音素。
[0051]进一步地,所述替换纠错模块,还用于在音素匹配成功时,根据匹配结果确定所述待纠错音节对应的音素组成类型,根据所述音素组成类型确定所述待纠错音节中的待替换音素。
[0052]进一步地,所述替换纠错模块,还用于将所述待替换音素替换为所述目标音素,获得目标音节,根据预设纠错策略对所述目标音节进行纠错,并将纠错后的音节转换为对应的目标字符,将待纠错字符替换为所述目标字符,获得纠错后的语音信息。
[0053]进一步地,所述替换纠错模块,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音纠错方法,其特征在于,所述语音纠错方法包括:在检测到语音信息存在错误时,确定所述语音信息中的待纠错字符;获取所述待纠错字符对应的待纠错音节;根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素;将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息。2.如权利要求1所述的语音纠错方法,其特征在于,所述根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素,包括:根据预设替换策略对所述待纠错音节中的各音素进行音素匹配;根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素。3.如权利要求2所述的语音纠错方法,其特征在于,所述根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素,包括:在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素;根据预设替换映射表确定所述待替换音素对应的目标音素。4.如权利要求3所述的语音纠错方法,其特征在于,所述在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素,包括:在音素匹配成功时,根据匹配结果确定所述待纠错音节对应的音素组成类型;根据所述音素组成类型确定所述待纠错音节中的待替换音素。5.如权利要求2所述的语音纠错方法,其特征在于,所述根据预设替换策略对所述待纠错音节中的各音素进行音素匹配之后,所述方法还包括:在音素匹配失败时,确定所述待纠错音节对应的音素组成类型;根据所述音素组成类型判断...

【专利技术属性】
技术研发人员:王宝臣
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1