一种语音识别方法及其相关设备技术

技术编号:30091387 阅读:20 留言:0更新日期:2021-09-18 08:53
本申请公开了一种语音识别方法及其相关设备,该方法包括:在获取到当前语音段和该当前语音段对应的参考语音后,先依据待使用状态数据和该当前语音段对应的参考语音,对该当前语音段进行编码处理,得到该当前语音段的语音编码和该当前语音段的编码状态数据;再对该当前语音段的语音编码进行解码处理,得到该当前语音段对应的语音文本,并利用该当前语音段的编码状态数据,更新该待使用状态数据。如此能够实现边采集用户语音边进行语音识别的目的,可以提高语音识别的实时性。又因当前语音段的历史语音信息(也就是,待使用状态数据)在历史语音识别过程中已计算过,使得在当前轮语音识别过程中直接使用即可,如此有利于提高语音识别的实时性。别的实时性。别的实时性。

【技术实现步骤摘要】
一种语音识别方法及其相关设备


[0001]本申请涉及人工智能
,尤其涉及一种语音识别方法及其相关设备。

技术介绍

[0002]随着语音识别技术的发展,语音识别技术的应用场景越来越广泛。例如,语音识别技术可以应用在语音输入法、语音助手、听见会议系统等等。
[0003]然而,因相关语音识别技术存在缺陷,使得基于该相关语音识别技术的语音识别过程具有较差的实时性。

技术实现思路

[0004]本申请实施例的主要目的在于提供一种语音识别方法及其相关设备,能够有效地提高语音识别的实时性。
[0005]本申请实施例提供了一种语音识别方法,所述方法包括:
[0006]获取当前语音段和所述当前语音段对应的参考语音;其中,所述参考语音的采集时间晚于所述当前语音段的采集时间;
[0007]依据待使用状态数据和所述当前语音段对应的参考语音,对所述当前语音段进行编码处理,得到所述当前语音段的语音编码和所述当前语音段的编码状态数据;
[0008]对所述当前语音段的语音编码进行解码处理,得到所述当前语音段对应的语音文本,并利用所述当前语音段的编码状态数据,更新所述待使用状态数据。
[0009]在一种可能的实施方式中,所述语音编码的确定过程,包括:
[0010]分别对所述当前语音段和所述当前语音段对应的参考语音进行特征提取,得到所述当前语音段的语音特征和所述当前语音段对应的参考特征;
[0011]按照所述待使用状态数据,对所述当前语音段的语音特征进行正向编码,得到所述当前语音段的正向编码结果;
[0012]依据所述当前语音段对应的参考特征,对所述当前语音段的语音特征进行反向编码,得到所述当前语音段的反向编码结果;
[0013]将所述当前语音段的正向编码结果和所述当前语音段的反向编码结果进行拼接,得到所述当前语音段的语音编码。
[0014]在一种可能的实施方式中,所述反向编码结果的确定过程,包括:
[0015]对所述当前语音段对应的参考特征进行反向编码,得到所述当前语音段对应的反向初始状态数据;
[0016]按照所述当前语音段对应的反向初始状态数据,对所述当前语音段的语音特征进行反向编码,得到所述当前语音段的反向编码结果。
[0017]在一种可能的实施方式中,所述依据所述当前语音段对应的参考特征,对所述当前语音段的语音特征进行反向编码,得到所述当前语音段的反向编码结果,包括:
[0018]将所述当前语音段的语音特征和所述当前语音段对应的参考特征输入预先构建
的简单回归单元SRU网络,得到所述SRU网络输出的所述当前语音段的反向编码结果。
[0019]在一种可能的实施方式中,所述编码状态数据的确定过程,包括:
[0020]对所述当前语音段进行特征提取,得到所述当前语音段的语音特征;
[0021]按照所述待使用状态数据,对所述当前语音段的语音特征进行正向编码,得到所述当前语音段的编码状态数据。
[0022]在一种可能的实施方式中,若所述当前语音段和所述当前语音段对应的参考语音是依据预设窗口尺寸进行采集的,且所述预设窗口参数包括识别窗口尺寸和参考窗口尺寸,则所述当前语音段和所述当前语音段对应的参考语音的采集过程,包括:
[0023]根据所述识别窗口尺寸,采集当前语音段;
[0024]根据所述参考窗口尺寸和所述当前语音段的采集结束时间点,确定所述参考数据采集时间段;
[0025]按照所述参考数据采集时间段,采集所述当前语音段对应的参考语音。
[0026]本申请实施例还提供了一种语音识别装置,包括:
[0027]语音获取单元,用于获取当前语音段和所述当前语音段对应的参考语音;其中,所述参考语音的采集时间晚于所述当前语音段的采集时间;
[0028]语音编码单元,用于依据待使用状态数据和所述当前语音段对应的参考语音,对所述当前语音段进行编码处理,得到所述当前语音段的语音编码和所述当前语音段的编码状态数据;
[0029]语音解码单元,用于对所述当前语音段的语音编码进行解码处理,得到所述当前语音段对应的语音文本;
[0030]数据更新单元,用于利用所述当前语音段的编码状态数据,更新所述待使用状态数据。
[0031]本申请实施例还提供了一种设备,所述设备包括:处理器、存储器、系统总线;
[0032]所述处理器以及所述存储器通过所述系统总线相连;
[0033]所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行本申请实施例提供的语音识别方法的任一实施方式。
[0034]本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行本申请实施例提供的语音识别方法的任一实施方式。
[0035]本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行本申请实施例提供的语音识别方法的任一实施方式。
[0036]基于上述技术方案,本申请具有以下有益效果:
[0037]本申请提供的语音识别方法中,在获取到当前语音段和该当前语音段对应的参考语音之后,先依据待使用状态数据和该当前语音段对应的参考语音,对该当前语音段进行编码处理,得到该当前语音段的语音编码和该当前语音段的编码状态数据;再对该当前语音段的语音编码进行解码处理,得到该当前语音段对应的语音文本,并利用该当前语音段的编码状态数据,更新该待使用状态数据,以便在下一轮语音识别过程中能够使用更新后的待使用状态数据进行编码处理。
[0038]其中,因当前语音段用于表示由拾音设备从用户语音流中实时采集的语音数据,使得本申请提供的语音识别方法能够针对实时采集的语音数据进行实时地语音识别,从而能够实现边进行语音采集边进行语音识别的目的,如此能够有效地提高语音识别的实时性。
[0039]还因待使用状态数据能够准确地表征出当前语音段的历史语音信息,且该当前语音段对应的参考语音能够准确地表示出当前语音段的未来语音信息,使得参考该待使用状态数据和该参考语音(也就是,参考该当前语音段的上下文信息)确定的语音编码能够更准确地表示出该当前语音段携带的语音信息,如此有利于提高语音识别准确性。
[0040]又因待使用状态数据是在历史语音识别过程(也就是,针对该当前语音段对应的历史语音进行语音识别的过程)中已经计算过的,使得当前轮语音识别过程可以直接使用待使用状态数据即可,无需重新计算该待使用状态数据,如此能够有效地降低针对当前语音的语音识别耗时,从而能够有效地提高针对当前语音的语音识别效率,进而有利于提高语音识别的实时性。
附图说明
[0041]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取当前语音段和所述当前语音段对应的参考语音;其中,所述参考语音的采集时间晚于所述当前语音段的采集时间;依据待使用状态数据和所述当前语音段对应的参考语音,对所述当前语音段进行编码处理,得到所述当前语音段的语音编码和所述当前语音段的编码状态数据;对所述当前语音段的语音编码进行解码处理,得到所述当前语音段对应的语音文本,并利用所述当前语音段的编码状态数据,更新所述待使用状态数据。2.根据权利要求1所述的方法,其特征在于,所述语音编码的确定过程,包括:分别对所述当前语音段和所述当前语音段对应的参考语音进行特征提取,得到所述当前语音段的语音特征和所述当前语音段对应的参考特征;按照所述待使用状态数据,对所述当前语音段的语音特征进行正向编码,得到所述当前语音段的正向编码结果;依据所述当前语音段对应的参考特征,对所述当前语音段的语音特征进行反向编码,得到所述当前语音段的反向编码结果;将所述当前语音段的正向编码结果和所述当前语音段的反向编码结果进行拼接,得到所述当前语音段的语音编码。3.根据权利要求2所述的方法,其特征在于,所述反向编码结果的确定过程,包括:对所述当前语音段对应的参考特征进行反向编码,得到所述当前语音段对应的反向初始状态数据;按照所述当前语音段对应的反向初始状态数据,对所述当前语音段的语音特征进行反向编码,得到所述当前语音段的反向编码结果。4.根据权利要求2所述的方法,其特征在于,所述依据所述当前语音段对应的参考特征,对所述当前语音段的语音特征进行反向编码,得到所述当前语音段的反向编码结果,包括:将所述当前语音段的语音特征和所述当前语音段对应的参考特征输入预先构建的简单回归单元SRU网络,得到所述SRU网络输出的所述当前语音段的反向编码结果。5.根据权利要求1所述的方法,其特征在于,所述编码状态数据的确定过程,包括:对所述当前语音段...

【专利技术属性】
技术研发人员:马志强吴明辉方昕刘俊华
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1