语音识别文本纠错方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37497601 阅读:10 留言:0更新日期:2023-05-07 09:34
本申请涉及一种语音识别文本纠错方法、装置、电子设备及存储介质,所述方法,通过获取输入音频对应的文本信息,依据文本信息进行编码转换,得到编码整型符号信息,依据编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息,并对语义特征信息和词性特征信息进行合并处理,得到编码器特征信息,以此基于编码器特征信息进行解码处理,得到文本信息对应的纠错文本信息,因此通过语义特征信息和词性特征信息共同作用下所得出的纠错文本信息,即可结合语义和词性两个部分对语音识别文本进行错别字纠错,最大化利用文本信息所包含的内容,让ASR转写的结果最接近真实且正确的结果,实现对语音识别文本地精准纠错,提高语音转写的正确率。音转写的正确率。音转写的正确率。

【技术实现步骤摘要】
语音识别文本纠错方法、装置、电子设备及存储介质


[0001]本申请涉及语音识别领域,尤其涉及一种语音识别文本纠错方法、装置、电子设备及存储介质。

技术介绍

[0002]随在自动语音识别技术(Automatic Speech Recognition,ASR)中常见的错误有多字、少字、同音异调、近音同调等。现有方案的ASR错别字纠正方法中,主要是通过Bert(Bidirectional Encoder RepresentationTransformer)模型进行提取带错别字语句的特征,利用Bert模型的注意力机制提取关键上下文信息,结合解码器,实现序列到序列的错别字纠正。
[0003]但是,上述错别字纠正方式中主要通过关键上下文信息进行分析纠错的过程中,仅能通过文本的句法、语义信息进行分析纠错,因此该方式很难纠需要依赖词性来做变换的字或词,例如“的”、“地”、“得”;“比划”、“笔划”,所以现有纠错方式存在纠错能力较低的问题。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种语音识别文本纠错方法、装置、电子设备及存储介质。
[0005]第一方面,本申请提供了一种语音识别文本纠错方法,包括:获取输入音频对应的文本信息;依据所述文本信息进行编码转换,得到编码整型符号信息;依据所述编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息;对所述语义特征信息和所述词性特征信息进行合并处理,得到编码器特征信息;基于所述编码器特征信息进行解码处理,得到所述文本信息对应的纠错文本信息。
[0006]可选的,所述依据所述文本信息进行编码转换,得到编码整型符号信息,包括:确定所述文本信息对应的文本字符信息;基于预设的映射表确定所述文本字符信息对应的编码整型符号信息。
[0007]可选的,所述依据所述编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息,包括:将所述编码整型符号信息输入至预设编码器,所述预设编码器包括纠正模型和词性标注模型;通过所述纠正模型对所述编码整型符号信息进行特征提取处理,得到所述语义特征信息;通过所述词性标注模型对所述编码整型符号信息进行特征提取处理,得到所述词
性特征信息。
[0008]可选的,所述通过所述纠正模型对所述编码整型符号信息进行特征提取处理,得到所述语义特征信息,包括:通过所述纠正模型对所述编码整型符号信息进行信息处理,输出第一维度的浮点矩阵;根据所述第一维度的浮点矩阵确定所述语义特征信息。
[0009]可选的,所述通过所述词性标注模型对所述编码整型符号信息进行特征提取处理,得到所述词性特征信息,包括:通过所述词性标注模型对所述编码整型符号信息进行信息处理,输出第二维度的整型矩阵;根据所述第二维度的整型矩阵确定所述词性特征信息。
[0010]可选的,所述基于所述编码器特征信息进行解码处理,得到所述文本信息对应的纠错文本信息,包括:基于线性解码模型对所述编码器特征信息进行解码处理,得到解码整型符号信息;基于预设的映射表确定所述解码整型符号信息对应的纠错文本字符信息;依据所述纠错文本字符信息确定所述文本信息对应的纠错文本信息。
[0011]可选的,基于所述编码器特征信息进行解码处理,得到所述文本信息对应的纠错文本信息之后,还包括:对比所述文本信息与所述纠错文本信息,确定所述文本信息中的错别字位置信息;依据所述错别字位置信息以及所述纠错文本信息,修正所述文本信息。
[0012]第二方面,本申请提供了一种语音识别文本纠错装置,包括:获取模块,用于获取输入音频对应的文本信息;编码转换模块,用于依据所述文本信息进行编码转换,得到编码整型符号信息;提取模块,用于依据所述编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息;合并模块,用于对所述语义特征信息和所述词性特征信息进行合并处理,得到编码器特征信息;解码模块,用于基于所述编码器特征信息进行解码处理,得到所述文本信息对应的纠错文本信息。
[0013]第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例所述的一种语音识别文本纠错方法的步骤。
[0014]第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的一种语音识别文本纠错方法的步骤。
[0015]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,通过获取输入音频对应的文本信息,依据文本信息进行编码转换,得到编码整型符号信息,依据编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息,并对语义特征信息和词性特征信息进行合并处理,得到编码器特征信息,以此基于编码器特征信息进行解码处理,得到文本信息对应的纠错文本信息,因此通过语义特征信息和词性特征信息共同作用下所得出的纠错文本信息,如此即可结合语义和词性两个部分对语音识别文本(即上述输入音频对应的文本信息)进行错别字纠错,相较于现有技术,本实施例可以最大化利用文本信息所包含的内容,让ASR转写的结果最接近真实且正确的结果,实现对语音识别文本地精准纠错,提高语音转写的正确率。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本申请实施例提供的一种语音识别文本纠错方法的流程示意图;图2为本申请另一实施例提供的一种语音识别文本纠错方法的流程示意图;图3为本申请实施例提供的一种语音识别文本纠错方法的场景示意图;图4为本申请另一实施例提供的一种语音识别文本纠错方法的场景示意图;图5为本申请另一实施例提供的一种语音识别文本纠错方法的场景示意图;图6为本申请实施例提供的一种语音识别文本纠错装置的结构示意图;图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0019]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]ASR语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连,由于语音信号的多样性和复杂性,语音识别系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别文本纠错方法,其特征在于,包括:获取输入音频对应的文本信息;依据所述文本信息进行编码转换,得到编码整型符号信息;依据所述编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息;对所述语义特征信息和所述词性特征信息进行合并处理,得到编码器特征信息;基于所述编码器特征信息进行解码处理,得到所述文本信息对应的纠错文本信息。2.根据权利要求1所述的方法,其特征在于,所述依据所述文本信息进行编码转换,得到编码整型符号信息,包括:确定所述文本信息对应的文本字符信息;基于预设的映射表确定所述文本字符信息对应的编码整型符号信息。3.根据权利要求1所述的方法,其特征在于,所述依据所述编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息,包括:将所述编码整型符号信息输入至预设编码器;所述预设编码器包括纠正模型和词性标注模型;通过所述纠正模型对所述编码整型符号信息进行特征提取处理,得到所述语义特征信息;通过所述词性标注模型对所述编码整型符号信息进行特征提取处理,得到所述词性特征信息。4.根据权利要求3所述的方法,其特征在于,所述通过所述纠正模型对所述编码整型符号信息进行特征提取处理,得到所述语义特征信息,包括:通过所述纠正模型对所述编码整型符号信息进行信息处理,输出第一维度的浮点矩阵;根据所述第一维度的浮点矩阵确定所述语义特征信息。5.根据权利要求3所述的方法,其特征在于,所述通过所述词性标注模型对所述编码整型符号信息进行特征提取处理,得到所述词性特征信息,包括:通过所述词性标注模型对所述编码整型符号信息进行信息处理,输出第二维度的整型矩阵;根据所述第二维度的整型矩阵确定所述词性特征信息。6.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:廖晨黄仁杰程刚刘金成
申请(专利权)人:深圳市北科瑞讯信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1