音频信息评价方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36450817 阅读:29 留言:0更新日期:2023-01-25 22:47
本公开关于一种音频信息评价方法、装置、电子设备及存储介质,该方法包括:对待处理音频进行演唱水平评价,得到所述待处理音频所对应的演唱水平评价结果;对所述待处理音频进行录音质量评价,得到所述待处理音频所对应的录音质量评价结果;根据所述演唱水平评价结果和所述录音质量评价结果,确定所述待处理音频的评价结果。本公开充分考虑了录制设备的录音质量这一固有因素的影响,可以提高评价结果的准确性。确性。确性。

【技术实现步骤摘要】
音频信息评价方法、装置、电子设备及存储介质


[0001]本公开涉及音频处理
,尤其涉及一种音频信息评价方法、装置、电子设备及存储介质。

技术介绍

[0002]随着终端技术的发展,K歌打分已经成为K歌类产品必备的功能。K歌打分主要是对用户的K歌音频进行评价,得到对应的分值。
[0003]相关技术中,可以使用多维度的K歌打分方式,来全面的描述用户的演唱水平。这种方式一般是在音准、节奏、气息、情感、音域、技巧、嗓音等维度给出综合评分。
[0004]可见,相关技术中只是对用户的演唱水平进行了评价,没有考虑到固有因素的影响,导致评价结果准确性不足。

技术实现思路

[0005]本公开提供一种音频信息评价方法、装置、电子设备及存储介质,以至少解决相关技术中评价结果准确性不足的问题。本公开的技术方案如下:
[0006]根据本公开实施例的第一方面,提供一种音频信息评价方法,包括:
[0007]对待处理音频进行演唱水平评价,得到所述待处理音频所对应的演唱水平评价结果;
[0008]对所述待处理音频进行录音质量评价,得到所述待处理音频所对应的录音质量评价结果;
[0009]根据所述演唱水平评价结果和所述录音质量评价结果,确定所述待处理音频的评价结果。
[0010]可选的,所述对所述待处理音频进行录音质量评价,得到所述待处理音频所对应的录音质量评价结果,包括:
[0011]按照至少一个录音质量因素分别对所述待处理音频进行录音质量评价,得到每个所述录音质量因素对应的评价结果;
[0012]根据每个所述录音质量因素所对应的权重,对所述至少一个录音质量因素对应的评价结果进行加权求和,得到所述录音质量评价结果。
[0013]可选的,所述录音质量因素包括信噪比;
[0014]所述按照至少一个录音质量因素分别对所述待处理音频进行录音质量评价,得到每个所述录音质量因素对应的评价结果,包括:
[0015]按照第一时间长度,将所述待处理音频划分为多个第一时间片段;
[0016]确定多个所述第一时间片段中具有人声的第一时间片段,得到至少一个第一人声片段;
[0017]针对每个所述第一人声片段,确定所述第一人声片段中人声音频信号与噪声音频信号的信噪比;
[0018]根据至少一个所述第一人声片段的信噪比,确定所述待处理音频的信噪比评价结果。
[0019]可选的,所述针对每个所述第一人声片段,确定所述第一人声片段中人声音频信号与噪声音频信号的信噪比,包括:
[0020]针对每个所述第一人声片段,对所述第一人声片段进行盲源分离,得到所述第一人声片段中的人声音频信号;
[0021]根据所述人声音频信号,确定所述第一人声片段中的人声能量和噪声能量;
[0022]确定所述人声能量与所述噪声能量的比例,得到所述第一人声片段中人声音频信号与噪声音频信号的信噪比。
[0023]可选的,所述针对每个所述第一人声片段,确定所述第一人声片段中人声音频信号与噪声音频信号的信噪比,包括:
[0024]将多个所述第一时间片段中除所述第一人声片段外的第一时间片段确定为噪声片段,得到至少一个噪声片段;
[0025]确定至少一个所述噪声片段的能量的平均值,作为所述噪声能量;
[0026]针对每个所述第一人声片段,将所述第一人声片段的能量确定为所述第一人声片段的人声能量;
[0027]确定所述人声能量与所述噪声能量的比例,得到所述第一人声片段中人声音频信号与噪声音频信号的信噪比。
[0028]可选的,所述根据至少一个所述第一人声片段的信噪比,确定所述待处理音频的信噪比评价结果,包括:
[0029]确定至少一个所述第一人声片段的信噪比的平均值,得到信噪比均值;
[0030]根据所述信噪比均值、第一信噪比阈值和第二信噪比阈值,确定所述待处理音频的信噪比评价结果,所述第一信噪比阈值小于所述第二信噪比阈值。
[0031]可选的,所述录音质量因素包括带宽;
[0032]所述按照至少一个录音质量因素分别对所述待处理音频进行录音质量评价,得到每个所述录音质量因素对应的评价结果,包括:
[0033]按照第二时间长度,将所述待处理音频划分为多个第二时间片段;
[0034]确定多个所述第二时间片段中具有人声的第二时间片段,得到至少一个第二人声片段;
[0035]针对每个所述第二人声片段,对所述第二人声片段按帧进行基频检测,将检测到基频的帧确定为浊音信号,将无法检测到基频的帧确定为清音信号;
[0036]确定所述第二人声片段中所述清音信号的带宽,并确定所述第二人声片段中所述浊音信号的带宽;
[0037]根据至少一个所述第二人声片段所对应的清音信号的带宽和浊音信号的带宽,确定所述待处理音频的带宽评价结果。
[0038]可选的,所述确定所述第二人声片段中所述清音信号的带宽,并确定所述第二人声片段中所述浊音信号的带宽,包括:
[0039]对所述第二人声片段中每一帧清音信号进行时频变换,得到每一帧清音信号的幅度谱,并对所述第二人声片段中每一帧浊音信号进行时频变换,得到每一帧浊音信号的幅
度谱;
[0040]根据每一帧所述清音信号的幅度谱,确定所述清音信号的带宽;
[0041]根据每一帧所述浊音信号的幅度谱,确定所述浊音信号的带宽。
[0042]可选的,所述根据每一帧所述清音信号的幅度谱,确定所述清音信号的带宽,包括:
[0043]根据每一帧所述清音信号的幅度谱,确定所述清音信号的平均幅度谱,作为清音幅度谱;
[0044]确定所述清音幅度谱中的最大幅度值,作为清音最大幅度值,并将所述清音最大幅度值的预设比例确定为清音参考幅度值;
[0045]确定所述清音幅度谱中幅度值大于所述清音参考幅度值的最高频率值,作为第一清音频率值;
[0046]确定所述清音幅度谱中幅度随频率下降最快的频率值,作为第二清音频率值;
[0047]将所述第一清音频率值和所述第二清音频率值中最小的频率值确定为所述清音信号的带宽;
[0048]所述根据每一帧所述浊音信号的幅度谱,确定所述浊音信号的带宽,包括:
[0049]根据每一帧所述浊音信号的幅度谱,确定所述浊音信号的平均幅度谱,作为浊音幅度谱;
[0050]确定所述浊音幅度谱中的最大幅度值,作为浊音最大幅度值,并将所述浊音最大幅度值的预设比例确定为浊音参考幅度值;
[0051]确定所述浊音幅度谱中幅度值大于所述浊音参考幅度值的最高频率值,作为第一浊音频率值;
[0052]确定所述浊音幅度谱中幅度随频率下降最快的频率值,作为第二浊音频率值;
[0053]将所述第一浊音频率值和所述第二浊音频率值中最小的频率值确定为所述浊音信号的带宽。
[0054]可选的,所述根据至少一个所述第二人声片段所对应的清音信号的带宽和浊音信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信息评价方法,其特征在于,包括:对待处理音频进行演唱水平评价,得到所述待处理音频所对应的演唱水平评价结果;对所述待处理音频进行录音质量评价,得到所述待处理音频所对应的录音质量评价结果;根据所述演唱水平评价结果和所述录音质量评价结果,确定所述待处理音频的评价结果。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理音频进行录音质量评价,得到所述待处理音频所对应的录音质量评价结果,包括:按照至少一个录音质量因素分别对所述待处理音频进行录音质量评价,得到每个所述录音质量因素对应的评价结果;根据每个所述录音质量因素所对应的权重,对所述至少一个录音质量因素对应的评价结果进行加权求和,得到所述录音质量评价结果。3.根据权利要求2所述的方法,其特征在于,所述录音质量因素包括信噪比;所述按照至少一个录音质量因素分别对所述待处理音频进行录音质量评价,得到每个所述录音质量因素对应的评价结果,包括:按照第一时间长度,将所述待处理音频划分为多个第一时间片段;确定多个所述第一时间片段中具有人声的第一时间片段,得到至少一个第一人声片段;针对每个所述第一人声片段,确定所述第一人声片段中人声音频信号与噪声音频信号的信噪比;根据至少一个所述第一人声片段的信噪比,确定所述待处理音频的信噪比评价结果。4.根据权利要求3所述的方法,其特征在于,所述根据至少一个所述第一人声片段的信噪比,确定所述待处理音频的信噪比评价结果,包括:确定至少一个所述第一人声片段的信噪比的平均值,得到信噪比均值;根据所述信噪比均值、第一信噪比阈值和第二信噪比阈值,确定所述待处理音频的信噪比评价结果,所述第一信噪比阈值小于所述第二信噪比阈值。5.根据权利要求2所述的方法,其特征在于,所述录音质量因素包括带宽;所述按照至少一个录音质量因素分别对所述待处理音频进行录音质量评价,得到每个所述录音质量因素对应的评价结果,包括:按照第二时间长度,将所述待处理音频划分为多个第二时间片段;确定多个所述第二时间片段中具有人声的第二时间片段,得到至少一个第二人声片段;针对每个所述第二人声片段,对所述第二人声片段按帧进行基频检测,将检测到基频的帧确定为浊音信号,将无法检测到基频的帧确定为清音信号;确定所述第二人声片段中所述清音信号的带宽,并确定所述第二人声片段中所述浊音信号的带宽;根据至少一个所述第二人声片段所对应的清音信号的带宽和浊音信号的带宽,确定所述待处理音频的带宽评价结果。6.根据权利要求5所述的方法,其特征在于,所述确定所述第二人声片段中所述清音信
号的带宽,并确定所述第二人声片段中所述浊音信号的带宽,包括:对所述第二人声片段中每一帧清音信号进行时频变换,得到每一帧清音信号的幅度谱,并对所述第二人声片段中每一帧浊音信号进行时频变换,得到每一帧浊音信号的幅度谱;根据每一帧所述清音信号的幅度谱,确定所述清音信号的带宽;根据每一帧所述浊音信号的幅度谱,确定所述浊音信号的带宽。7.根据权利要求6所述的方法,其特征在于,所述根据每一帧所述清音信号的幅度谱,确定所述清音信号的带宽,包括:根据每一帧所述清音信号的幅度谱,确定所述清音信号的平均幅度谱,作为清音幅度谱;确定所述清音幅度谱中的最大幅度值,作为清音最大幅度值,并将所述清音最大幅度值的预设比例确定为清音参考幅度值;确定所述清音幅度谱中幅度值大于所述清音参考幅度值的最高频率值,作为第一清音频率值;确定所述清音幅度谱中幅度随频率下降最快的频率值,作为第二清音频率值;将所述第一清音频率值和所述第二清音频率值中最小的频率值确定为所述清音信号的带宽;所述根据每一帧所述浊音信号的幅度谱,确定所述浊音信号的带宽,包括:根据每一帧所述浊音信号的幅度谱,确定所述浊音信号的平均幅度谱,作为浊音幅度谱;确定所述浊音幅度谱中的最大幅度值,作为浊音最大幅度值,并将所述浊音最大幅度值的预设比例确定为浊音参考幅度值;确定所述浊音幅度谱中幅度值大于所述浊音参考幅度值的最高频率值,作...

【专利技术属性】
技术研发人员:魏耀都张晨郑羲光
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1