一种文本获取方法、装置、存储介质和计算机设备制造方法及图纸

技术编号:35775836 阅读:14 留言:0更新日期:2022-12-01 14:19
本申请公开了一种文本获取方法、装置、存储介质及电子设备,其中,方法包括:获取对目标音频进行识别所得到的识别文本集合,识别文本集合包括音频识别系统集合中各音频识别系统分别对目标音频进行识别所得到的多个识别文本,音频识别系统集合中包括至少三个音频识别系统,音频识别系统集合中的音频识别系统与识别文本集合中的识别文本一一对应,在识别文本集合中分别获取两个识别文本之间的编辑距离,基于多个编辑距离,在音频识别系统集合中确定目标音频识别系统,在识别文本集合中将目标音频识别系统对应的目标识别文本,确定为目标音频的输出文本。采用本申请,通过计算不同识别文本之间的编辑距离确定目标识别文本,提高文本获取的准确性。本获取的准确性。本获取的准确性。

【技术实现步骤摘要】
一种文本获取方法、装置、存储介质和计算机设备


[0001]本申请涉及计算机
,尤其涉及一种文本获取方法、装置、存储介质和计算机设备。

技术介绍

[0002]现有技术中经常使用自动语音识别技术进行语音识别,将语音转换为文本内容,但是现有的自动语音识别技术主要依赖于人工设置的语音转换规则,准确性较低,识别时间较长,需要提出一种准确性较高的语音识别方法。

技术实现思路

[0003]本申请实施例提供了一种文本获取方法、装置、存储介质及电子设备,可以通过计算不同识别文本之间的编辑距离确定目标识别文本,提高文本获取的准确性。所述技术方案如下:
[0004]第一方面,本申请实施例提供了一种文本获取方法,包括:获取对目标音频进行识别所得到的识别文本集合,所述识别文本集合包括音频识别系统集合中各音频识别系统分别对所述目标音频进行识别所得到的多个识别文本,所述音频识别系统集合中包括至少三个音频识别系统,所述音频识别系统集合中的音频识别系统与所述识别文本集合中的识别文本一一对应;在所述识别文本集合中分别获取两个识别文本之间的编辑距离,基于多个所述编辑距离,在所述音频识别系统集合中确定目标音频识别系统;在所述识别文本集合中将所述目标音频识别系统对应的目标识别文本,确定为所述目标音频的输出文本。
[0005]第二方面,本申请实施例提供一种文本获取装置,包括:文本集合获取模块,用于获取对目标音频进行识别所得到的识别文本集合,所述识别文本集合包括音频识别系统集合中各音频识别系统分别对所述目标音频进行识别所得到的多个识别文本,所述音频识别系统集合中包括至少三个音频识别系统,所述音频识别系统集合中的音频识别系统与所述识别文本集合中的识别文本一一对应;目标系统确定模块,用于在所述识别文本集合中分别获取两个识别文本之间的编辑距离,基于多个所述编辑距离,在所述音频识别系统集合中确定目标音频识别系统;输出文本确定模块,用于在所述识别文本集合中将所述目标音频识别系统对应的目标识别文本,确定为所述目标音频的输出文本。
[0006]第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法的步骤。
[0007]第四方面,本申请实施例提供一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法的步骤。
[0008]在本申请实施例中,获取对目标音频进行识别所得到的识别文本集合,识别文本集合包括音频识别系统集合中各音频识别系统分别对目标音频进行识别所得到的多个识别文本,音频识别系统集合中包括至少三个音频识别系统,音频识别系统集合中的音频识
别系统与识别文本集合中的识别文本一一对应,在识别文本集合中分别获取两个识别文本之间的编辑距离,基于多个编辑距离,在音频识别系统集合中确定目标音频识别系统,在识别文本集合中将目标音频识别系统对应的目标识别文本,确定为目标音频的输出文本。通过计算不同识别文本之间的编辑距离确定目标识别文本,提高了文本获取的准确性。
附图说明
[0009]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1是本申请实施例提供的一种文本获取的举例示意图;
[0011]图2是本申请实施例提供的一种文本获取方法的流程示意图;
[0012]图3是本申请实施例提供的一种文本获取方法的流程示意图;
[0013]图4是本申请实施例提供的一种编辑举例获取的举例示意图;
[0014]图5是本申请实施例提供的一种文本获取方法的流程示意图;
[0015]图6是本申请实施例提供的一种文本获取装置的结构示意图;
[0016]图7是本申请实施例提供的一种目标系统确定模块的结构示意图;
[0017]图8是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0018]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019]文本获取装置可以为手机、电脑、平板电脑、智能手表或车载设备等终端设备,也可以为终端设备中用于实现文本获取方法的模块,文本获取装置可以获取目标音频,并获取目标音频对应的文本内容,即目标音频的输出文本。目标音频可以为用户针对终端设备所录入的包含语音信息的音频,也可以为终端设备本地保存或从网络上获取的音频。文本获取装置获取到目标音频的输出文本后可以在终端设备上显示输出文本。
[0020]请一并参见图1,为本申请实施例提供了一种文本获取的举例示意图,文本识别装置可以获取用户所输入的目标音频,并使用音频识别系统对目标音频进行识别,音频识别系统即为自动语音识别技术(Automatic Speech Recognition,ASR)系统,可以将人的语音转换为文本。文本识别装置可以使用音频识别系统集合中各音频识别系统分别对目标音频进行识别得到多个识别文本,如图1中的识别文本1、识别文本2、...、识别文本n,n为大于或等于2的整数,音频识别系统集合中包括至少三个音频识别系统,然后文本获取装置可以基于编辑距离在多个识别文本中找到一个目标识别文本,将目标识别文本的确定为输出文本,然后控制终端设备显示输出文本。编辑距离为针对二个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。
[0021]下面结合具体的实施例对本申请提供的文本获取方法进行详细说明。
[0022]请参见图2,为本申请实施例提供了一种文本获取方法的流程示意图。如图2所示,本申请实施例的所述方法可以包括以下步骤S101

S103。
[0023]S101,获取对目标音频进行识别所得到的识别文本集合。
[0024]具体的,文本获取装置可以使用音频识别系统集合中的各音频识别系统分别对目标音频进行识别,从而得到多个识别文本并保存在识别文本集合中,可以理解的是,音频识别系统集合中的音频识别系统与识别文本集合中的识别文本一一对应,一个音频识别系统对应一个识别文本。
[0025]S102,在识别文本集合中分别获取两个识别文本之间的编辑距离,基于多个编辑距离,在音频识别系统集合中确定目标音频识别系统。
[0026]具体的,文本获取装置可以在文本集合中分别获取两个识别文本之间的编辑距离从而得到多个编辑距离,例如文本集合中有三个识别文本,则文本获取装置可以得到四个编辑距离。文本获取装置可以根据这多个编辑距离在音频识别系统集合中确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本获取方法,其特征在于,包括:获取对目标音频进行识别所得到的识别文本集合,所述识别文本集合包括音频识别系统集合中各音频识别系统分别对所述目标音频进行识别所得到的多个识别文本,所述音频识别系统集合中包括至少三个音频识别系统,所述音频识别系统集合中的音频识别系统与所述识别文本集合中的识别文本一一对应;在所述识别文本集合中分别获取两个识别文本之间的编辑距离,基于多个所述编辑距离,在所述音频识别系统集合中确定目标音频识别系统;在所述识别文本集合中将所述目标音频识别系统对应的目标识别文本,确定为所述目标音频的输出文本。2.根据权利要求1所述的方法,其特征在于,所述在所述识别文本集合中分别获取两个识别文本之间的编辑距离,基于多个所述编辑距离,在所述音频识别系统集合中确定目标音频识别系统,包括:在所述识别文本集合中分别获取两个识别文本之间的编辑距离;基于多个所述编辑距离分别确定所述各音频识别系统对应的编辑距离总和;基于所述各音频识别系统对应的编辑距离总和,在所述音频识别系统集合中确定目标音频识别系统。3.根据权利要求2所述的方法,其特征在于,所述在所述识别文本集合中分别获取两个识别文本之间的编辑距离,包括:在所述识别文本集合中获取第一音频识别系统对应的第一识别文本,所述第一音频识别系统为所述音频识别系统集合中的任一音频识别系统;分别获取所述第一识别文本与所述识别文本集合中的第二识别文本之间的第一编辑距离,所述第二识别文本为所述识别文本集合中除所述第一识别文本外的其它识别文本。4.根据权利要求3所述的方法,其特征在于,所述基于所述各音频识别系统对应的编辑距离总和,在所述音频识别系统集合中确定目标音频识别系统,包括:在所述各音频识别系统对应的编辑距离总和中确定最小编辑距离总和,在所述音频识别系统集合中将所述最小编辑距离总和对应的第二音频识别系统确定为目标音频识别系统。5.根据权利要求3所述的方法,其特征在于,所述基于多个所述编辑距离分别确定所述各音频识别系统对应的编辑距离总和,包括:基于预设阈值和多个所述第一编辑距离,将所述第一音频识别系统确定为候选音频识别系统;基于多个所述第一编辑距离确定所述候选音频识别系统对应的编辑距离总和;所述基于所述各音频识别系统对应的编辑距离总和,在所述音频识别系统集合中确定目标音频识别系统,包括:基于所述候选音频...

【专利技术属性】
技术研发人员:王智彪杨明祺吕志强
申请(专利权)人:名日之梦北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1