一种文本获取方法、装置、存储介质和计算机设备制造方法及图纸

技术编号：35775836 阅读：14 留言：0更新日期：2022-12-01 14:19

本申请公开了一种文本获取方法、装置、存储介质及电子设备，其中，方法包括：获取对目标音频进行识别所得到的识别文本集合，识别文本集合包括音频识别系统集合中各音频识别系统分别对目标音频进行识别所得到的多个识别文本，音频识别系统集合中包括至少三个音频识别系统，音频识别系统集合中的音频识别系统与识别文本集合中的识别文本一一对应，在识别文本集合中分别获取两个识别文本之间的编辑距离，基于多个编辑距离，在音频识别系统集合中确定目标音频识别系统，在识别文本集合中将目标音频识别系统对应的目标识别文本，确定为目标音频的输出文本。采用本申请，通过计算不同识别文本之间的编辑距离确定目标识别文本，提高文本获取的准确性。本获取的准确性。本获取的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本获取方法、装置、存储介质和计算机设备

[0001]本申请涉及计算机
，尤其涉及一种文本获取方法、装置、存储介质和计算机设备。

技术介绍

[0002]现有技术中经常使用自动语音识别技术进行语音识别，将语音转换为文本内容，但是现有的自动语音识别技术主要依赖于人工设置的语音转换规则，准确性较低，识别时间较长，需要提出一种准确性较高的语音识别方法。

技术实现思路

[0003]本申请实施例提供了一种文本获取方法、装置、存储介质及电子设备，可以通过计算不同识别文本之间的编辑距离确定目标识别文本，提高文本获取的准确性。所述技术方案如下：
[0004]第一方面，本申请实施例提供了一种文本获取方法，包括：获取对目标音频进行识别所得到的识别文本集合，所述识别文本集合包括音频识别系统集合中各音频识别系统分别对所述目标音频进行识别所得到的多个识别文本，所述音频识别系统集合中包括至少三个音频识别系统，所述音频识别系统集合中的音频识别系统与所述识别文本集合中的识别文本一一对应；在所述识别文本集合中分别获取两个识别文本之间的编辑距离，基于多个所述编辑距离，在所述音频识别系统集合中确定目标音频识别系统；在所述识别文本集合中将所述目标音频识别系统对应的目标识别文本，确定为所述目标音频的输出文本。
[0005]第二方面，本申请实施例提供一种文本获取装置，包括：文本集合获取模块，用于获取对目标音频进行识别所得到的识别文本集合，所述识别文本集合包括音频识别系统集合中各音频识别系统分别对所述目标音频进行识别所得到...

【技术保护点】

【技术特征摘要】
1.一种文本获取方法，其特征在于，包括：获取对目标音频进行识别所得到的识别文本集合，所述识别文本集合包括音频识别系统集合中各音频识别系统分别对所述目标音频进行识别所得到的多个识别文本，所述音频识别系统集合中包括至少三个音频识别系统，所述音频识别系统集合中的音频识别系统与所述识别文本集合中的识别文本一一对应；在所述识别文本集合中分别获取两个识别文本之间的编辑距离，基于多个所述编辑距离，在所述音频识别系统集合中确定目标音频识别系统；在所述识别文本集合中将所述目标音频识别系统对应的目标识别文本，确定为所述目标音频的输出文本。2.根据权利要求1所述的方法，其特征在于，所述在所述识别文本集合中分别获取两个识别文本之间的编辑距离，基于多个所述编辑距离，在所述音频识别系统集合中确定目标音频识别系统，包括：在所述识别文本集合中分别获取两个识别文本之间的编辑距离；基于多个所述编辑距离分别确定所述各音频识别系统对应的编辑距离总和；基于所述各音频识别系统对应的编辑距离总和，在所述音频识别系统集合中确定目标音频识别系统。3.根据权利要求2所述的方法，其特征在于，所述在所述识别文本集合中分别获取两个识别文本之间的编辑距离，包括：在所述识别文本集合中获取第一音频识别系统对应的第一识别文本，所述第一音频识别系统为所述音频识别系统集合中的任一音频识别系统；分别获取所述第一识别文本与所述识别文本集合中的第二识别文本之间的第一编辑距离，所述第二识别文本为所述识别文本集合中除所述第一识别文本外的其它识别文本。4.根据权利要求3所述的方法，其特征在于，所述基于所述各音频识别系统对应的编辑距离总和，在所述音频识别系统集合中确定目标音频识别系统，包括：在所述各音频识别系统对应的编辑距离总和中确定最小编辑距离总和，在所述音频识别系统集合中将所述最小编辑距离总和对应的第二音频识别系统确定为目标音频识别系统。5.根据权利要求3所述的方法，其特征在于，所述基于多个所述编辑距离分别确定所述各音频识别系统对应的编辑距离总和，包括：基于预设阈值和多个所述第一编辑距离，将所述第一音频识别系统确定为候选音频识别系统；基于多个所述第一编辑距离确定所述候选音频识别系统对应的编辑距离总和；所述基于所述各音频识别系统对应的编辑距离总和，在所述音频识别系统集合中确定目标音频识别系统，包括：基于所述候选音频...

【专利技术属性】
技术研发人员：王智彪，杨明祺，吕志强，
申请(专利权)人：名日之梦北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人