一种语音识别方法、装置及电子设备制造方法及图纸

技术编号：32930283 阅读：12 留言：0更新日期：2022-04-07 12:21

本申请公开了一种语音识别方法、装置及电子设备，对待识别语音数据对应的初步识别文本以第一处理模式进行处理，得到第一文本；对第一文本以第二处理模式进行处理，得到第二文本；基于第一文本和第二文本，确定与待识别语音数据对应的目标文本。由于第一处理模式为按照文本正向词序列进行文本识别的模式，第二处理模式为按照文本反向词序列进行文本识别的模式。可以实现对文本上下文信息的有效利用，提升了对语音进行识别的准确性。提升了对语音进行识别的准确性。提升了对语音进行识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法、装置及电子设备

[0001]本申请涉及信息处理
，尤其涉及一种语音识别方法、装置及电子设备。

技术介绍

[0002]语音识别是对语音信号解码，将语音信号转换为对应的文本的过程。通常语音文本的上下文中包含着大量有效信息，然而现有的语音识别过程并不能很好地利用上下文信息，使得识别结果并不准确，最终输出的文本存在偏差。

技术实现思路

[0003]有鉴于此，本申请提供如下技术方案：
[0004]一种语音识别方法，包括：
[0005]获取待识别语音数据对应的初步识别文本；
[0006]对所述初步识别文本以第一处理模式进行处理，得到第一文本；
[0007]对所述第一文本以第二处理模式进行处理，得到第二文本；
[0008]基于所述第一文本和所述第二文本，确定与所述待识别语音数据对应的目标文本；
[0009]其中，所述第一处理模式为按照文本正向词序列进行文本识别的模式，所述第二处理模式为按照文本反向词序列进行文本识别的模式。
[0010]可选地，所述对所述第一文本以第二处理模式进行处理，得到第二文本，包括：
[0011]确定所述第一文本的每一词组；
[0012]确定与每一词组原始正向顺序对应的反向顺序；
[0013]基于每一词组和所述反向顺序，确定第一文本对应的反向文本；
[0014]对所述反向文本进行处理，得到第二文本。
[0015]可选地，所述对所述反向文本进行处理，得到第二文本，包括：
>[0016]将所述反向文本输入至第二处理模型，得到与每一反向候选词序列对应的概率值；
[0017]基于每一反向候选词序列对应的概率值，在反向候选词序列中确定第二文本；
[0018]其中，所述第二处理模型为基于第二语料库确定词序列概率的模型，所述第二语料库包括多条反向顺序的语料信息。
[0019]可选地，所述对所述初步识别文本以第一处理模式进行处理，得到第一文本，包括：
[0020]对所述初步识别文本进行分词处理，得到第一词序列，所述第一词序列包括多个词组，且各个词组按照正向顺序组成所述第一词序列；
[0021]将所述第一词序列输入至第一处理模型，获得与每一候选词序列对应的概率值；
[0022]基于与每一候选词序列对应的概率值，在所述候选词序列中确定第一文本；
[0023]其中，所述第一处理模型为基于第一语料库确定词序列概率的模型，所述第一语
料库包括多条正向顺序的语料信息。
[0024]可选地，所述基于所述第一文本和所述第二文本，确定与所述待识别语音数据对应的目标文本，包括：
[0025]分别获取所述第一处理模式和所述第二处理模式对应的权重信息；
[0026]基于所述权重信息对所述第一文本和所述第二文本进行处理，得到与待识别语音数据对应的目标文本。
[0027]可选地，所述分别获取所述第一处理模式和所述第二处理模式对应的权重信息，包括：
[0028]确定与所述待识别语音数据相匹配的目标场景；
[0029]检测所述第一处理模式和所述第二处理模式是否包括与所述目标场景对应的语料信息，得到检测结果；
[0030]基于所述检测结果，分别确定所述第一处理模式和所述第二处理模式对应的权重信息。
[0031]可选地，所述获取待识别语音数据的初步识别文本，包括：
[0032]基于声学模型确定与待识别语音数据对应的音素信息，所述声学模型为基于语音数据的声学特征进行音素识别的模型；
[0033]获取与所述待识别语音数据相匹配的目标场景；
[0034]确定与所述目标场景对应的目标词典；
[0035]基于所述目标词典对所述音素信息进行处理，得到初步识别文本。
[0036]可选地，所述基于所述第一文本和所述第二文本，确定与所述待识别语音数据对应的目标文本，包括：
[0037]基于所述第一文本和所述第二文本，确定第三文本；
[0038]基于所述目标词典对所述第三文本进行后处理，得到目标文本。
[0039]一种语音识别装置，包括：
[0040]获取单元，用于获取待识别语音数据对应的初步识别文本；
[0041]第一处理单元，用于对所述初步识别文本以第一处理模式信息处理，得到第一文本；
[0042]第二处理单元，用于对所述第一文本以第二处理模式进行处理，得到第二文本；
[0043]确定单元，用于基于所述第一文本和所述第二文本，确定与所述待识别语音数据对应的目标文本；
[0044]其中，所述第一处理模式为按照文本正向词序列进行文本识别的模式，所述第二处理模式为按照文本反向词序列进行文本识别的模式。
[0045]一种电子设备，包括：
[0046]存储器，用于存储程序；
[0047]处理器，用于调用并执行所述存储器中的所述程序，通过执行所述程序实现如上任一项所述的语音识别方法的各个步骤。
[0048]从上述技术方案可以看出，本申请公开的一种语音识别方法、装置及电子设备，对待识别语音数据对应的初步识别文本以第一处理模式进行处理，得到第一文本；对第一文本以第二处理模式进行处理，得到第二文本；基于第一文本和第二文本，确定与待识别语音
数据对应的目标文本。由于第一处理模式为按照文本正向词序列进行文本识别的模式，第二处理模式为按照文本反向词序列进行文本识别的模式。可以实现对文本上下文信息的有效利用，提升了对语音进行识别的准确性。
附图说明
[0049]为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0050]图1为本申请实施例一提供的一种语音识别方法的流程示意图；
[0051]图2为本申请实施例二提供的一种目标场景的语音识别方法的示意图；
[0052]图3为本申请实施例三提供的一种语音识别装置的结构示意图；
[0053]图4为本申请实施例四提供的一种电子设备的结构示意图。
具体实施方式
[0054]下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。
[0055]本申请实施例提供了一种语音识别方法，可以应用于将语音数据转换成文本数据的领域，在转换过程中能够充分利用对应的上下文信息，提升了语音数据转换文本的准确性。
[0056]请参见图1，为本申请实施例一提供的一种语音识别方法的流程示意图，该方法可以包括以下步骤：
[0057]S101、获取本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，包括：获取待识别语音数据对应的初步识别文本；对所述初步识别文本以第一处理模式进行处理，得到第一文本；对所述第一文本以第二处理模式进行处理，得到第二文本；基于所述第一文本和所述第二文本，确定与所述待识别语音数据对应的目标文本；其中，所述第一处理模式为按照文本正向词序列进行文本识别的模式，所述第二处理模式为按照文本反向词序列进行文本识别的模式。2.根据权利要求1所述的方法，所述对所述第一文本以第二处理模式进行处理，得到第二文本，包括：确定所述第一文本的每一词组；确定与每一词组间原始正向顺序对应的反向顺序；基于每一词组和所述反向顺序，确定第一文本对应的反向文本；对所述反向文本进行处理，得到第二文本。3.根据权利要求2所述的方法，所述对所述反向文本进行处理，得到第二文本，包括：将所述反向文本输入至第二处理模型，得到与每一反向候选词序列对应的概率值；基于每一反向候选词序列对应的概率值，在反向候选词序列中确定第二文本；其中，所述第二处理模型为基于第二语料库确定词序列概率的模型，所述第二语料库包括多条反向顺序的语料信息。4.根据权利要求1所述的方法，所述对所述初步识别文本以第一处理模式进行处理，得到第一文本，包括：对所述初步识别文本进行分词处理，得到第一词序列，所述第一词序列包括多个词组，且各个词组按照正向顺序组成所述第一词序列；将所述第一词序列输入至第一处理模型，获得与每一候选词序列对应的概率值；基于与每一候选词序列对应的概率值，在所述候选词序列中确定第一文本；其中，所述第一处理模型为基于第一语料库确定词序列概率的模型，所述第一语料库包括多条正向顺序的语料信息。5.根据权利要求1所述的方法，所述基于所述第一文本和所述第二文本，确定与所述待识别语音数据对应的目标文本，包括：分别获取所述第一处理模式和所述第二处理模式对应的权重信息；基于...

【专利技术属性】
技术研发人员：侯婧宇，郭莉莉，赵泽清，
申请(专利权)人：联想北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人