语音质量评估方法及装置、存储介质、电子设备制造方法及图纸

技术编号:38683648 阅读:10 留言:0更新日期:2023-09-02 22:56
本公开实施例是关于一种语音质量评估方法及装置、计算机可读存储介质、以及电子设备,涉及计算机技术领域,该方法包括:获取语料文件以及对应的录音文件;分别基于训练后的评估模型提取所述语料文件对应的语料特征,并提取所述录音文件对应的录音特征;对所述语料特征和所述录音特征进行融合得到融合特征,并对所述融合特征进行拟合得到评估结果。本公开能够提高语音质量评估的准确性。提高语音质量评估的准确性。提高语音质量评估的准确性。

【技术实现步骤摘要】
语音质量评估方法及装置、存储介质、电子设备


[0001]本公开实施例涉及计算机
,具体而言,涉及一种语音质量评估方法、语音质量评估装置、计算机可读存储介质以及电子设备。

技术介绍

[0002]为了提高移动通信过程中的通话质量,可以对移动通信过程中的通话质量进行评价。
[0003]相关技术中,可以基于MOS(Mean Opinion Score,平均意见分)的方式来进行预测。具体地,可通过专业仪表对无线网络传输后的退化信号进行处理,变换后与原始信号进行比较,再通过认知模型,从而映射到对主观平均意见分的预测。
[0004]上述方式中,通过两个通信终端进行放音和录音测试,比较经过网络传输后的有损波形与原始波形的差异,使用的是主观模型,无法与用户感知直接关联。并且,可能导致MOS评分较低以及评估不准确的情况。

技术实现思路

[0005]本公开的目的在于提供一种语音质量评估方法、语音质量评估装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的语音质量评估的准确性较低的问题。
[0006]根据本公开的第一方面,提供一种语音质量评估方法,包括:获取语料文件以及对应的录音文件;分别基于训练后的评估模型提取所述语料文件对应的语料特征,并提取所述录音文件对应的录音特征;对所述语料特征和所述录音特征进行融合得到融合特征,并对所述融合特征进行拟合得到评估结果。
[0007]在本公开的一种示例性实施例中,所述分别基于训练后的评估模型提取所述语料文件对应的语料特征,并提取所述录音文件对应的录音特征,包括:分别将所述语料文件以及所述录音文件进行预加重、分帧以及切片操作,得到对应的梅谱图;对所述梅谱图进行卷积处理,得到所述语料文件对应的语料特征以及所述录音文件对应的录音特征。
[0008]在本公开的一种示例性实施例中,所述对所述语料特征和所述录音特征进行融合得到融合特征,并对所述融合特征进行拟合得到评估结果,包括:将所述语料特征和所述录音特征进行拼接得到拼接特征;对所述拼接特征进行全连接处理,得到所述评估结果。
[0009]在本公开的一种示例性实施例中,所述方法还包括:基于参考评估方式对样本语料文件以及样本录音文件进行评估,得到参考评估结果;基于评估模型对样本语料文件以及样本录音文件进行评估,得到预测评估结果;结合所述参考评估结果和所述预测评估结果进行分析,并根据分析结果对所述评估模型进行训练,以得到训练后的评估模型。
[0010]在本公开的一种示例性实施例中,所述结合所述参考评估结果和所述预测评估结果进行分析,并根据分析结果对所述评估模型进行训练,以得到训练后的评估模型,包括:基于损失函数对所述参考评估结果和所述预测评估结果进行度量,得到所述参考评估结果
和所述预测评估结果之间的差异数据;基于所述差异数据对所述评估模型进行训练,得到训练后的评估模型。
[0011]在本公开的一种示例性实施例中,所述基于所述差异数据对所述评估模型进行训练,得到训练后的评估模型,包括:对所述差异数据进行对比分析,并确定所述差异数据对应的求导变更率,以对所述差异数据进行平滑;基于平滑后的差异数据对所述评估模型的模型参数进行迭代调整,直至满足训练结束条件为止,以得到所述训练后的评估模型。
[0012]在本公开的一种示例性实施例中,所述基于平滑后的差异数据对所述评估模型的模型参数进行迭代调整,直至满足训练结束条件为止,以得到所述训练后的评估模型,包括:按照学习率,基于所述平滑后的差异数据对所述评估模型的模型参数进行迭代调整,直至输出的预测评估结果与所述参考评估结果之间的差值小于差值阈值为止,以得到所述训练后的评估模型。
[0013]根据本公开的第二方面,提供一种语音质量评估装置,包括:文件获取模块,用于获取语料文件以及对应的录音文件;分别基于训练后的评估模型提取所述语料文件对应的语料特征,并提取所述录音文件对应的录音特征;对所述语料特征和所述录音特征进行融合得到融合特征,并对所述融合特征进行拟合得到评估结果。
[0014]根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的语音质量评估方法。
[0015]根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的语音质量评估方法。
[0016]本公开实施例中提供的语音质量评估方法、语音质量评估装置、计算机可读存储介质以及电子设备中,一方面,训练后的评估模型对任意类型的语料文件的处理方式均相同,因此在任意切换语料文件的情况下不影响评估过程,更切合各类实际应用场合,提高了与真实场合的匹配度和真实性。另一方面,训练后的评估模型应对各类新增问题,减少因终端声卡等因素或者是语料文件以及录音文件存在差别时导致的MOS评分偏低的不准确的问题,提高了评估结果的全面性和准确性。再一方面,通过训练后的评估模型来进行语音质量评估,由于训练后的评估模型是应用特定环境、特定因素的大批量训练而得到的,可以随着训练的丰富及完善,使语音评估可以应对各类新增问题,增加了应用范围,提高了通用性。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0018]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1示意性示出本公开实施例的一种用于语音质量评估的系统架构图。
[0020]图2示意性示出本公开实施例的一种语音质量评估方法的流程图。
[0021]图3示意性示出本公开实施例对原始录音文件进行预处理的流程图。
[0022]图4示意性示出本公开实施例语料文件以及录音文件之间进行传输的具体流程图。
[0023]图5示意性示出本公开实施例基于评估模型进行评估的流程示意图。
[0024]图6示意性示出本公开实施例进行评估模型训练的流程示意图。
[0025]图7示意性示出本公开实施例对评估模型进行训练具体流程的示意图。
[0026]图8示意性示出本公开实施例根据训练后的评估模型进行质量评估的流程示意图。
[0027]图9示意性示出本公开实施例语音质量评估装置的框图示意图。
[0028]图10示意性示出本公开实施例电子设备的框图示意图。
具体实施方式
[0029]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音质量评估方法,其特征在于,包括:获取语料文件以及对应的录音文件;分别基于训练后的评估模型提取所述语料文件对应的语料特征,并提取所述录音文件对应的录音特征;对所述语料特征和所述录音特征进行融合得到融合特征,并对所述融合特征进行拟合得到评估结果。2.根据权利要求1所述的语音质量评估方法,其特征在于,所述分别基于训练后的评估模型提取所述语料文件对应的语料特征,并提取所述录音文件对应的录音特征,包括:分别将所述语料文件以及所述录音文件进行预加重、分帧以及切片操作,得到对应的梅谱图;对所述梅谱图进行卷积处理,得到所述语料文件对应的语料特征以及所述录音文件对应的录音特征。3.根据权利要求1所述的语音质量评估方法,其特征在于,所述对所述语料特征和所述录音特征进行融合得到融合特征,并对所述融合特征进行拟合得到评估结果,包括:将所述语料特征和所述录音特征进行拼接得到拼接特征;对所述拼接特征进行全连接处理,得到所述评估结果。4.根据权利要求1所述的语音质量评估方法,其特征在于,所述方法还包括:基于参考评估方式对样本语料文件以及样本录音文件进行评估,得到参考评估结果;基于评估模型对样本语料文件以及样本录音文件进行评估,得到预测评估结果;结合所述参考评估结果和所述预测评估结果进行分析,并根据分析结果对所述评估模型进行训练,以得到训练后的评估模型。5.根据权利要求4所述的语音质量评估方法,其特征在于,所述结合所述参考评估结果和所述预测评估结果进行分析,并根据分析结果对所述评估模型进行训练,以得到训练后的评估模型,包括:基于损失函数对所述参考评估结果和所述预测评估结果进行度量,得到所述参考评估结果和所述预测评估...

【专利技术属性】
技术研发人员:黄毅华刘瑞强李建光许向东陈秀敏
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1