语音评估方法、装置及电子设备制造方法及图纸

技术编号:35482670 阅读:17 留言:0更新日期:2022-11-05 16:34
本公开提供一种语音评估方法、装置及电子设备,所述方法包括:对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。本公开实施例能够提高语音评估的效率,且能够提高语音评估的准确性。且能够提高语音评估的准确性。且能够提高语音评估的准确性。

【技术实现步骤摘要】
语音评估方法、装置及电子设备


[0001]本专利技术涉及人工智能
,尤其涉及一种语音评估方法、装置及电子设备。

技术介绍

[0002]在模型训练的过程中需要大量的干净数据作为训练样本。干净数据是指理论上没有噪声的语音数据。语音数据的噪声越小,则语音的干净程度越高,越适合作为模型训练的干净数据。目前通过在安静环境下录制语音获得用于模型训练的干净数据。为避免录制的语音的干净程度较低,通常是播放录制的语音,由人耳判定语音的干净程度,语音评估的效率较低。

技术实现思路

[0003]本公开实施例提供一种语音评估方法、装置及电子设备,以解决现有技术中由人耳判定语音的干净程度导致的语音评估的效率较低的问题。
[0004]为了解决上述技术问题,本专利技术是这样实现的:
[0005]第一方面,本公开实施例提供了一种语音评估方法,所述方法包括:
[0006]对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;
[0007]基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;
[0008]基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。
[0009]第二方面,本公开实施例提供了一种语音评估装置,所述装置包括:
[0010]分割模块,用于对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;
[0011]第一确定模块,用于基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;
[0012]第二确定模块,用于基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。
[0013]第三方面,本公开实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的语音评估方法中的步骤。
[0014]第四方面,本公开实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的语音评估方法中的步骤。
[0015]在本公开实施例中,对待评估语音进行语音分割,得到所述待评估语音对应的第
一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。这样,通过所述至少一个评估指标值确定所述待评估语音的语音干净程度,能够实现语音干净程度的自动评估,从而能够提高语音评估的效率,且能够提高语音评估的准确性。
附图说明
[0016]为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本公开实施例提供的一种语音评估方法的流程图;
[0018]图2是本公开实施例提供的一种语音评估装置的结构示意图;
[0019]图3是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0020]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]在本公开实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载移动终端、可穿戴设备、以及计步器等。
[0022]参见图1,图1是本公开实施例提供的一种语音评估方法的流程图,如图1所示,包括以下步骤:
[0023]步骤101、对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段。
[0024]其中,待评估语音对应的第一语音段可以包括对待评估语音进行语音分割得到的至少一个语音段。待评估语音对应的第一非语音段可以包括对待评估语音进行语音分割得到的至少一个非语音段。
[0025]一种实施方式中,待评估语音对应的第一语音段可以包括对待评估语音进行语音分割得到的全部语音段。待评估语音对应的第一非语音段可以包括对待评估语音进行语音分割得到的全部非语音段。
[0026]一种实施方式中,可以确定待评估语音的帧长及帧移等,对待评估语音进行分帧,在分帧后,可以采用语音活动检测(Voice Activity Detection,VAD)算法对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段。
[0027]步骤102、基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比。
[0028]其中,所述至少一个评估指标值可以包括第一评估指标值、第二评估指标值、第三
评估指标值及第四评估指标值中的一项或多项。所述第一评估指标值基于第二语音段确定,所述第二语音段基于所述第一语音段进行低通滤波处理后获得。所述第二评估指标值基于第二非语音段确定,所述第二非语音段基于所述第一非语音段进行低通滤波处理后获得。所述第三评估指标值基于所述第一语音段的基频及所述基频的倍频对应的数据点确定。所述第四评估指标值基于所述第一语音段的能量值与所述第一非语音段的能量值确定。
[0029]步骤103、基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。
[0030]其中,所述至少一个评估指标值越大,则待评估语音的语音干净程度越高。
[0031]需要说明的是,目前针对语音的模型训练方法中,通常使用的是监督训练的方法,而监督训练中干净数据的选择对模型的效果有着十分重要的作用,可以直接影响模型的效果。语音数据的噪声越小,则语音的干净程度越高,越适合作为模型训练的干净数据。
[0032]一种实施方式中,所述至少一个评估指标值可以包括第一评估指标值、第二评估指标值、第三评估指标值及第四评估指标值,可以将满足第一评估指标值大于第一预设阈值、第二评估指标值大于第二预设阈值、第三评估指标值大于第三预设阈值且第四评估指标值大于第四预设阈值的待评估数据用于模型训练,能够提高模型训练的效果。该第一预设阈值、第二预设阈值、第三预设阈值及第四预设阈值可以按照实际需求设置。
[0033]在本公开实施例中,对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音评估方法,其特征在于,所述方法包括:对待评估语音进行语音分割,得到所述待评估语音对应的第一语音段和第一非语音段;基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,所述至少一个评估指标值用于指示所述待评估语音中的干净语音在所述待评估语音中的能量占比;基于所述至少一个评估指标值确定所述待评估语音的语音干净程度。2.根据权利要求1所述的方法,其特征在于,所述至少一个评估指标值包括如下至少一项:第一评估指标值;第二评估指标值;第三评估指标值;第四评估指标值;其中,所述第一评估指标值基于第二语音段确定,所述第二语音段基于所述第一语音段进行低通滤波处理后获得;所述第二评估指标值基于第二非语音段确定,所述第二非语音段基于所述第一非语音段进行低通滤波处理后获得;所述第三评估指标值基于所述第一语音段的基频及所述基频的倍频对应的数据点确定;所述第四评估指标值基于所述第一语音段的能量值与所述第一非语音段的能量值确定。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:对所述第一语音段进行低通滤波处理,得到第二语音段;对所述第一语音段进行高通滤波处理,得到第三语音段;确定第一比值,所述第一比值为所述第二语音段的能量均值与所述第三语音段的能量均值的比值;其中,所述至少一个评估指标值包括第一评估指标值,所述第一评估指标值为所述第一比值。4.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:对所述第一非语音段进行低通滤波处理,得到第二非语音段;对所述第一非语音段进行高通滤波处理,得到第三非语音段;确定第二比值,所述第二比值为所述第二非语音段的能量均值与所述第三非语音段的能量均值的比值;其中,所述至少一个评估指标值包括第二评估指标值,所述第二评估指标值为所述第二比值。5.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一语音段和/或所述第一非语音段确定至少一个评估指标值,包括:确定所述第一语音段中的第一数据点,所述第一数据点为所述第...

【专利技术属性】
技术研发人员:李良斌
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1