音频检测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:36734287 阅读:23 留言:0更新日期:2023-03-04 10:03
本申请涉及一种音频检测方法、装置、计算机设备和存储介质。所述方法包括:获取待检测音频中的多个音频片段,确定第一检测模型和第二检测模型;提取每个音频片段分别在多个不同音频维度下的子音频特征;通过第一检测模型,对由音频片段的至少一个子音频特征构成的第一特征集合进行音频检测处理,得到与音频片段对应的第一检测结果;通过第二检测模型,对由音频片段的至少一个子音频特征构成的第二特征集合进行音频检测处理,得到与音频片段对应的第二检测结果;根据各音频片段分别对应的第一检测结果和第二检测结果,确定与待检测音频对应的音频检测结果。采用本方法能够提升音频检测的检测效率。检测的检测效率。检测的检测效率。

【技术实现步骤摘要】
音频检测方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种音频检测方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着科学技术的发展,发音设备被应用于各行各业,比如,刷脸支付设备可通过喇叭等发音设备对支付结果进行语音播报。由于发音设备的应用广泛,因此,各发音设备的生产厂商在生产发音设备时,均会对所生产的发音设备进行质检,以确定发音设备所播放的音频为正常音频。
[0003]目前,主要是按比例抽取一定数量的发音设备,并采集抽取出的发音设备所播放的待检测音频,通过音频实验室中的硬件检测设备,对待检测音频进行检测,得到检测结果,并根据检测结果确定相应发音设备的质检结果。然而,通过硬件检测设备对待检测音频检测时所需要的试验环境较为复杂,从而导致音频检测的效率低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提升音频检测的效率的音频检测方法、装置、计算机设备和存储介质。
[0005]一种音频检测方法,所述方法包括:
[0006]获取待检测音频中的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频检测方法,其特征在于,所述方法包括:获取待检测音频中的多个音频片段,确定第一检测模型和第二检测模型,其中,所述第一检测模型和第二检测模型为通过集成学习得到的模型;提取每个音频片段分别在多个不同音频维度下的子音频特征;通过所述第一检测模型,对由所述音频片段的至少一个子音频特征构成的第一特征集合进行音频检测处理,得到与所述音频片段对应的第一检测结果;通过所述第二检测模型,对由所述音频片段的至少一个子音频特征构成的第二特征集合进行音频检测处理,得到与所述音频片段对应的第二检测结果;其中,所述第二特征集合中具有所述第一特征集合中没有的子音频特征;根据各音频片段分别对应的第一检测结果和第二检测结果,确定与所述待检测音频对应的音频检测结果。2.根据权利要求1所述的方法,其特征在于,所述获取待检测音频中的多个音频片段,包括:获取待质检发音设备播放的待检测音频,并通过预设的分段时长和分段步长,对所述待检测音频进行分段处理,得到多个音频片段;所述方法还包括:根据所述待检测音频的音频检测结果,确定所述发音设备的质检结果。3.根据权利要求1所述的方法,其特征在于,所述音频维度至少包括音色维度、音调维度和饱和度维度;所述音色维度的子音频特征包括梅尔倒谱特征和频谱质心特征;所述音调维度的子音频特征包括梅尔频谱特征;所述饱和度维度的子音频特征包括过零率特征和频谱平坦度特征;所述第一特征集合包括梅尔频谱特征和梅尔倒谱特征;所述第二特征集合包括梅尔频谱特征、梅尔倒谱特征、频谱质心特征过零率特征和频谱平坦度特征。4.根据权利要求3所述的方法,其特征在于,所述提取每个音频片段分别在多个不同音频维度下的子音频特征,包括:确定快速傅里叶变换的采样点数与不同音频维度下的各子音频特征之间的对应关系;通过所述对应关系所包括的多个采样点数,对音频片段进行快速傅里叶变换,得到多个频谱图;根据所述对应关系,分别从每个频谱图中进行相应子音频特征的提取。5.根据权利要求1所述的方法,其特征在于,所述通过所述第一检测模型,对由所述音频片段的至少一个子音频特征构成的第一特征集合进行音频检测处理,得到与所述音频片段对应的第一检测结果,包括:将与所述音频片段对应的频谱图分别与第一特征集合中的各子音频特征进行特征拼接处理,得到多个第一待处理特征;由所述第一检测模型对所述多个第一待处理特征进行特征处理,得到特征处理结果,并根据所述特征处理结果,得到所述音频片段的第一检测结果。6.根据权利要求5所述的方法,其特征在于,所述第一检测模型包括多个第一处理层;所述由所述第一检测模型对所述多个第一待处理特征进行特征处理,得到特征处理结果,包括:通过多个第一处理层中的首个第一处理层,对所述多个第一待处理特征进行特征处
理,得到首个第一处理层输出的结果;对于除首个第一处理层之外的各个第一处理层,均将相应第一处理层之前的前序第一处理层的输出结果作为相应第一处理层的输入数据,每个第一处理层均对各自的输入数据进行特征处理,得到各个第一处理层各自输出的结果;根据最后一层第一处理层输出的结果和所述多个第一待处理特征,得到与所述第一特征集合对应的特征处理结果。7.根据权利要求1所述的方法,其特征在于,所述通过所述第二检测模型,对由所述音频片段的至少一个子音频特征构成的第二特征集合进行音频检测处理,得到与所述音频片段对应的第二检测结果,包括:将与所述音频片段对应的频谱图分别与第二特征集合中的各子音频特征进行特征拼接处理,得到多个第二待处理特征;由所述第二检测模型对所述多个第二待处理特征进行特征处理,得到特征处理结果,并根据所述特征处理结果,得到所述音频片段的第二检测结果。8.根据权利要求7所述的方法,其特征在于,所述第二检测模型包括多个第二处理层;所述由所述第二检测模型对所述多个第二待处理特征进行特征处理,得到特征处理结果,包括:通过多个第二处理层中的首个第二处理层,对所述多个第二待处理特征进行特征处理,得到首个第二处理层输出的结果;对于除首个第二处理层之外的各个第二处理层,均将多个第二待处理特征、以及相应第二处理层之前的前序第二处理层的输出结果,作为相应第二处理层的输入数据,每个二处理层均对各自的输入数据进行特征处理,得到各个第二处理层各自输出的结果;根据最后一层第二处理层输出的结果,得到与所述第二特征集合对应的特征处理结果。9.根据权利要求8所述的方法,其特征在于,所述第二处理层包括池化层和卷积层;所述每个二处理层均对各自的输入数据进行特征处理,得到各个第二处理层各自输出的结果,包括:对于除首个第二处理层之外的各个第二处理层,均通过当前第二处理层中的卷积层,对位于当前第二处理层之前的前序第二处理层的输出结果和多个第二待处理特征进行卷积处理,得到卷积结果;通过所述当前第二处理层中的池化层对所述卷积结果和多个第二待处理...

【专利技术属性】
技术研发人员:杨伟明郭润增王少鸣唐惠忠
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1