语音数据处理方法、装置及电子设备制造方法及图纸

技术编号:36683403 阅读:17 留言:0更新日期:2023-02-27 19:43
本申请实施例提供了一种语音数据处理方法、装置、电子设备及计算机可读存储介质,涉及语音识别技术领域。该方法包括:通过接收第一语音,基于语音识别模型,对所述第一语音进行语音识别,确定所述第一语音对应的识别信息;根据所述识别信息,执行所述第一语音对应的处理操作。由于语音识别模型为基于目标样本语音进行训练得到的,所述目标样本语音为对初始样本语音进行语音检测得到的,这样,得到的目标样本语音的语音质量较高,从而使得基于该目标样本语音训练的语音识别模型的语音识别精度较高,提升了语音识别的准确度。提升了语音识别的准确度。提升了语音识别的准确度。

【技术实现步骤摘要】
语音数据处理方法、装置及电子设备


[0001]本申请涉及语音识别
,具体而言,本申请涉及一种语音数据处理方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]目前,人工智能技术已被广泛应用于语音处理的多种应用场景,例如,人工智能技术可以应用于语音唤醒、语音识别、语音合成等应用场景。其中,在上述应用场景的处理中,通常需要语音识别模型来进行语音信息的识别,然而,目前,语音识别模型识别精度仍然较低,容易出现识别错误或识别失败等情况,给用户带来不便。

技术实现思路

[0003]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是语音识别模型的语音识别精度较低,导致语音识别的准确度较低的技术缺陷。
[0004]根据本申请的一个方面,提供了一种语音数据处理方法,该方法包括:接收第一语音;
[0005]基于语音识别模型,对所述第一语音进行语音识别,确定所述第一语音对应的识别信息;其中,所述语音识别模型为基于样本语音数据库中的目标样本语音进行训练得到的,所述目标样本语音为对初始样本语音进行语音检测得到的;其中,所述语音检测包括:语速检测、关键词频次检测以及留白检测中的至少一种;
[0006]根据所述识别信息,执行所述第一语音对应的处理操作。
[0007]可选的,所述对所述第一语音进行语音识别之前,所述方法还包括:
[0008]接收所述初始样本语音;
[0009]对所述初始样本语音进行所述语音检测,根据所述语音检测的检测结果,筛选满足预设样本要求的所述初始样本语音作为目标样本语音。
[0010]可选的,所述对所述初始样本语音进行所述语音检测,包括:
[0011]将所述初始样本语音分割成多个语音帧,确定所述语音帧中的有效语音帧;
[0012]筛选连续的有效语音帧的帧数量大于预设数量的语段作为有效语段;
[0013]对包括所述有效语段的所述初始样本语音进行所述语音检测。
[0014]可选的,所述确定所述语音帧中的有效语音帧,包括:
[0015]提取所述语音帧的声学特征;
[0016]确定所述语音帧的声学特征符合预设特征条件的情况下,确定所述语音帧为所述有效语音帧。
[0017]可选的,在所述语音检测包括留白检测的情况下,所述对所述初始样本语音进行所述语音检测,包括:
[0018]确定相邻的所述有效语段之间的间隔时长;
[0019]确定所述间隔时长是否在第一标准时长范围之内。
[0020]可选的,在所述语音检测包括语速检测的情况下,所述对所述初始样本语音进行所述语音检测,包括:
[0021]将所述有效语段的语段时长与第二标准时长范围进行比较,确定所述语段时长是否在所述第二标准时长范围之内。
[0022]可选的,在所述语音检测包括关键词频次检测的情况下,所述对所述初始样本语音进行所述语音检测,包括:
[0023]对所述有效语段进行语音识别,确定所述有效语段中是否包含目标关键词,以及包含所述目标关键词的有效语段的数量是否大于预设阈值。
[0024]可选的,所述根据所述语音检测的检测结果,筛选满足预设样本要求的所述初始样本语音作为目标样本语音,包括:
[0025]在所述语音检测包括单项检测的情况下,确定单项检测的检测结果满足预设样本要求的所述初始样本语音作为目标样本语音;
[0026]在所述语音检测包括多项检测的情况下,确定多项检测中,至少预设数量的检测结果满足预设样本要求的所述初始样本语音作为目标样本语音。
[0027]可选的,在所述接收所述初始样本语音之前,所述方法还包括:
[0028]接收第二语音;
[0029]确定所述第二语音中包含目标唤醒词的情况下,发送提示语音,和/或显示第一提示信息;
[0030]所述提示语音及所述第一提示信息指示开始采集所述初始样本语音;其中,所述第一提示信息中包括以下至少一项:
[0031]目标关键词;
[0032]目标关键词的采集次数;
[0033]目标关键词的之间的间隔时长。
[0034]可选的,所述方法还包括:
[0035]确定所述初始样本语音不满足预设样本条件的情况下,显示第二提示信息;
[0036]所述第二提示信息指示重新采集所述初始样本语音。
[0037]根据本申请的另一个方面,提供了一种语音数据处理装置,该装置包括:
[0038]接收模块,用于接收第一语音;
[0039]识别模块,用于基于语音识别模型,对所述第一语音进行语音识别,确定所述第一语音对应的识别信息;其中,所述语音识别模型为基于样本语音数据库中的目标样本语音进行训练得到的,所述目标样本语音为对初始样本语音进行语音检测得到的;其中,所述语音检测包括:语速检测、关键词频次检测以及留白检测中的至少一种;
[0040]执行模块,用于根据所述识别信息,执行所述第一语音对应的处理操作。
[0041]根据本申请的另一个方面,提供了一种电子设备,该电子设备包括:
[0042]一个或多个处理器;
[0043]存储器;
[0044]一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据本申请的第一方面任一项所述的语音数据处理方法。
[0045]例如,本申请的第三方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
[0046]存储器用于存放至少一可执行指令,可执行指令使处理器执行如本申请的第一方面所示的语音数据处理方法对应的操作。
[0047]根据本申请的再一个方面,提供了一种计算机可读存储介质,所述计算机程序被处理器执行时实现本申请的第一方面任一项所述的语音数据处理方法。
[0048]例如,本申请实施例的第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本申请第一方面所示的语音数据处理方法。
[0049]根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面的各种可选实现方式中提供的方法。
[0050]本申请提供的技术方案带来的有益效果是:
[0051]本申请实施例中,在语音识别的过程中,接收第一语音,基于语音识别模型,对所述第一语音进行语音识别,并执行所述第一语音对应的处理操作;其中,语音识别模型训练过程中所采用的目标样本语音是经过语音检测得到的,所述语音检测包括语速检测、关键词频次检测以及留白检测中的至少一种;这样,通过语音检测得到语音质量较高的目标样本语音,从而提高语音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音数据处理方法,其特征在于,包括:接收第一语音;基于语音识别模型,对所述第一语音进行语音识别,确定所述第一语音对应的识别信息;其中,所述语音识别模型为基于样本语音数据库中的目标样本语音进行训练得到的,所述目标样本语音为对初始样本语音进行语音检测得到的;其中,所述语音检测包括:语速检测、关键词频次检测以及留白检测中的至少一种;根据所述识别信息,执行所述第一语音对应的处理操作。2.根据权利要求1所述的语音数据处理方法,其特征在于,所述对所述第一语音进行语音识别之前,所述方法还包括:接收所述初始样本语音;对所述初始样本语音进行所述语音检测,根据所述语音检测的检测结果,筛选满足预设样本要求的所述初始样本语音作为目标样本语音。3.根据权利要求2所述的语音数据处理方法,其特征在于,所述对所述初始样本语音进行所述语音检测,包括:将所述初始样本语音分割成多个语音帧,确定所述语音帧中的有效语音帧;筛选连续的有效语音帧的帧数量大于预设数量的语段作为有效语段;对包括所述有效语段的所述初始样本语音进行所述语音检测。4.根据权利要求3所述的语音数据处理方法,其特征在于,所述确定所述语音帧中的有效语音帧,包括:提取所述语音帧的声学特征;确定所述语音帧的声学特征符合预设特征条件的情况下,确定所述语音帧为所述有效语音帧。5.根据权利要求3所述的语音数据处理方法,其特征在于,在所述语音检测包括留白检测的情况下,所述对所述初始样本语音进行所述语音检测,包括:确定相邻的所述有效语段之间的间隔时长;确定所述间隔时长是否在第一标准时长范围之内。6.根据权利要求3所述的语音数据处理方法,其特征在于,在所述语音检测包括语速检测的情况下,所述对所述初始样本语音进行所述语音检测,包括:将所述有效语段的语段时长与第二标准时长范围进行比较,确定所述语段时长是否在所述第二标准时长范围之内。7.根据权利要求3所述的语音数据处理方法,其特征在于,在所述语音检测包括关键词频次检测的情况下,所述对所述初始样本语音进行所述语音检测,包括:对所述有效语段进行语音识别,确定所述有效语段中是否包含目标关键词,以及包含所述目标关键词的有效语段的...

【专利技术属性】
技术研发人员:王炳乾刘童
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1