一种语音识别的文本纠错方法、装置、设备及存储介质制造方法及图纸

技术编号：41285608 阅读：3 留言：0更新日期：2024-05-11 09:34

本申请实施例公开了一种语音识别的文本纠错方法、装置、设备及存储介质。本申请实施例提供的技术方案，通过获取目标语音片段的语音识别结果，基于语音识别结果查询预构建的辅助信息文本列表，确定对应的目标辅助信息；进而将语音识别结果和目标辅助信息输入预构建的文本纠错模型，输出语音识别结果的文本纠错结果。该文本纠错模型预先基于训练样本以及训练样本对应的辅助信息进行训练。采用上述技术手段，通过引入训练样本的辅助信息进行纠错模型训练，后续通过输入语音识别结果和相应的辅助信息进行模型文本纠错，以此可以借助辅助信息精准纠错语音识别结果的识别误差，进而提升文本纠错精度，保障语音识别效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及语音识别，尤其涉及一种语音识别的文本纠错方法、装置、设备及存储介质。

技术介绍

1、目前，在语音识别场景中，通常会通过文本纠错技术对语音识别的输出文本进行纠错，以此来提升语音识别精准度。在进行文本纠错过程中，通常利用语音片段内的上下文信息，结合文本纠错模型在海量数据中学习到的不可控信息进行文本纠错。

2、但是，现有的文本纠错模型一般会通过学习一些通用的数据以进行文本纠错。对于特定领域下的语音识别场景，其文本纠错效果相对有限，难以准确纠错，进而导致语音识别误差。

技术实现思路

1、本申请实施例提供一种语音识别的文本纠错方法、装置、设备及存储介质，能够进行精准文本纠错，解决文本纠错模型的纠正误差问题。

2、在第一方面，本申请实施例提供了一种语音识别的文本纠错方法，包括：

3、获取目标语音片段的语音识别结果，基于语音识别结果查询预构建的辅助信息文本列表，确定对应的目标辅助信息；

4、将语音识别结果和目标辅助信息输入预构建的文本纠错模型，输出语音识别结果的文本纠错结果，文本纠错模型预先基于训练样本以及训练样本对应的辅助信息进行训练。

5、在第二方面，本申请实施例提供了一种语音识别的文本纠错装置，包括：

6、识别模块，用于获取目标语音片段的语音识别结果，基于语音识别结果查询预构建的辅助信息文本列表，确定对应的目标辅助信息；

7、纠错模块，用于将语音识别结果和目标辅助信息输入预构建的文本纠错模型

8、在第三方面，本申请实施例提供了一种电子设备，包括：

9、存储器以及一个或多个处理器；

10、所述存储器，用于存储一个或多个程序；

11、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面所述的语音识别的文本纠错方法。

12、在第四方面，本申请实施例提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的语音识别的文本纠错方法。

13、本申请实施例通过获取目标语音片段的语音识别结果，基于语音识别结果查询预构建的辅助信息文本列表，确定对应的目标辅助信息；进而将语音识别结果和目标辅助信息输入预构建的文本纠错模型，输出语音识别结果的文本纠错结果。该文本纠错模型预先基于训练样本以及训练样本对应的辅助信息进行训练。采用上述技术手段，通过引入训练样本的辅助信息进行文本纠错模型训练，后续通过输入语音识别结果和相应的辅助信息进行模型文本纠错，以此可以借助辅助信息精准纠错语音识别结果的识别误差，进而提升文本纠错精度，保障语音识别效果。

本文档来自技高网...

【技术保护点】

1.一种语音识别的文本纠错方法，其特征在于，包括：

2.根据权利要求1所述的语音识别的文本纠错方法，其特征在于，所述文本纠错模型的训练流程包括：

3.根据权利要求2所述的语音识别的文本纠错方法，其特征在于，所述从所述模型输入片段和所述模型输出片段中抽取数据作为所述辅助信息，基于所述辅助信息、所述模型输入片段和对应的所述模型输出片段构建数据对，包括：

4.根据权利要求3所述的语音识别的文本纠错方法，其特征在于，所述第一数据对中，使用预设定的模型辨识标识将所述第一辅助信息与所述模型输入片段和所述模型输出片段分隔；所述第二数据对中，使用预设定的模型辨识标识将所述第二辅助信息与所述模型输入片段和所述模型输出片段分隔。

5.根据权利要求4所述的语音识别的文本纠错方法，其特征在于，所述将所述语音识别结果和所述目标辅助信息输入预构建的文本纠错模型，包括：

6.根据权利要求1所述的语音识别的文本纠错方法，其特征在于，所述获取目标语音片段的语音识别结果，包括：

7.根据权利要求6所述的语音识别的文本纠错方法，其特征在于，所述基

8.根据权利要求1所述的语音识别的文本纠错方法，其特征在于，所述目标语音片段对应课堂教学语音进行采集；

9.一种语音识别的文本纠错装置，其特征在于，包括：

10.一种电子设备，其特征在于，包括：

11.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8任一所述的语音识别的文本纠错方法。

...

【技术特征摘要】

1.一种语音识别的文本纠错方法，其特征在于，包括：

2.根据权利要求1所述的语音识别的文本纠错方法，其特征在于，所述文本纠错模型的训练流程包括：

5.根据权利要求4所述的语音识别的文本纠错方法，其特征在于，所述将所述...

【专利技术属性】
技术研发人员：刘承标，
申请(专利权)人：广州视源电子科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人