音频评估方法及装置制造方法及图纸

技术编号:33926045 阅读:21 留言:0更新日期:2022-06-25 21:45
本公开关于一种音频评估方法及装置。该音频评估方法包括:对至少一个音频进行基频检测,得到所述至少一个音频的音高序列;基于评估模式对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行序列对齐处理,并将所述至少一个音频中的每个音频的互相对齐的音高序列和参考音高序列作为所述至少一个音频中的每个音频的音高序列和参考音高序列;基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果;基于所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果确定所述至少一个音频的评估结果。根据本公开的音频评估方法及装置,可提高音频评估结果的准确性。评估结果的准确性。评估结果的准确性。

【技术实现步骤摘要】
音频评估方法及装置


[0001]本公开涉及音视频
更具体地,本公开涉及一种音频评估方法及装置。

技术介绍

[0002]卡拉OK是一种伴奏系统,演唱者可以在预先录制的音乐伴奏下参与歌唱,在电子屏幕上同步播放有节拍提示的歌词,然后由演唱者边看歌词边持麦克风唱歌。卡拉OK能通过声音处理使演唱者的声音得到美化与润饰,当再与音乐伴奏有机结合时,就变成了浑然一体的立体声歌曲。这种演唱方式,给歌唱爱好者们带来了极大的方便和愉悦,是人们休闲娱乐的一种方式,现多叫K歌。
[0003]随着移动互联网的普及,现在人们不止会在线下KTV歌房里K歌,还会在手机K歌软件上在线K歌。线下K歌成本高,而在线K歌不仅成本低而且使用门槛也低。为了给在线K歌的音乐爱好者们提供比肩线下甚至超越线下的K歌体验,K歌软件往往会有丰富的K歌功能,例如音频3A、智能降噪、智能混音、K歌打分、声伴对齐、智能修音等。现有软件的K歌打分功能只有一种模式,并且为了让大多数普通演唱者获得较好的主观使用体验,在这种打分模式下打分比较宽松,分数比较高,提升了演唱者的自信心,让其拥有再次使用的欲望。但对于那些有一定音乐素养的演唱者来说,现有的打分模式不能较好地体现他们的专业能力,评分粒度太粗。因此,需要设计一种能满足专业演唱者打分需求的K歌打分方法,以提高频评估结果的准确性。

技术实现思路

[0004]本公开的示例性实施例在于提供一种音频评估方法及装置,以至少解决相关技术中的音频评估的问题,也可不解决任何上述问题。
[0005]根据本公开的示例性实施例,提供一种音频评估方法,包括:对至少一个音频进行基频检测,得到所述至少一个音频的音高序列;基于评估模式对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行序列对齐处理,并将所述至少一个音频中的每个音频的互相对齐的音高序列和参考音高序列作为所述至少一个音频中的每个音频的音高序列和参考音高序列;基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果;基于所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果确定所述至少一个音频的评估结果。
[0006]可选地,基于评估模式对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行序列对齐处理,可包括:当评估模式是第一评估模式时,对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行第一粒度的序列对齐处理;当评估模式是第二评估模式时,对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行第二粒度的序列对齐处理,其中,第一粒度大于第二粒度。
[0007]可选地,基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音高评估结果,可包括:分别确定所述至少一个音频中的每个音频的音高序列和参考
音高序列之间的平均音高距离;根据所述至少一个音频中的每个音频的平均音高距离分别确定所述至少一个音频中的每个音频的音高评估结果。
[0008]可选地,基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音准评估结果以及节奏评估结果,可包括:分别确定所述至少一个音频中的每个音频的音高序列和参考音高序列之间的相似度距离和相对序列偏移;基于所述至少一个音频中的每个音频的相似度距离分别确定所述至少一个音频中的每个音频的音准评估结果;基于所述至少一个音频中的每个音频的相对序列偏移分别确定所述至少一个音频中的每个音频的节奏评估结果。
[0009]可选地,分别确定所述至少一个音频的音高序列和参考音高序列之间的相似度距离和相对序列偏移,可包括:分别对所述至少一个音频中的每个音频的音高序列和参考音高序列执行动态时间规整,得到所述至少一个音频中的每个音频的音高序列和参考音高序列之间的相似度距离和相对序列偏移。
[0010]可选地,基于所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果确定所述至少一个音频的评估结果,可包括:分别确定所述至少一个音频中的每个音频的音高评估结果、音准评估结果以及节奏评估结果的平均值;将所述至少一个音频中的每个音频的所述平均值分别确定为所述至少一个音频中的每个音频的评估结果。
[0011]可选地,所述至少一个音频包括一段歌的音频,所述至少一个音频中的每个音频是所述一段歌中的一句歌的音频。
[0012]可选地,所述音频评估方法还可包括:对所述至少一个音频中的每个音频的评估结果执行平均处理,得到所述至少一个音频的总评估结果。
[0013]可选地,所述音频评估方法还可包括:基于所述至少一个音频的总评估结果确定所述至少一个音频的等级。
[0014]根据本公开的示例性实施例,提供一种音频评估装置,包括:基频检测单元,被配置为对至少一个音频进行基频检测,得到所述至少一个音频的音高序列;序列对齐单元,被配置为基于评估模式对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行序列对齐处理,并将所述至少一个音频中的每个音频的互相对齐的音高序列和参考音高序列作为所述至少一个音频中的每个音频的音高序列和参考音高序列;第一确定单元,被配置为基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果;和第二确定单元,被配置为基于所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果确定所述至少一个音频的评估结果。
[0015]可选地,序列对齐单元,被配置为:当评估模式是第一评估模式时,对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行第一粒度的序列对齐处理;当评估模式是第二评估模式时,对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行第二粒度的序列对齐处理,其中,第一粒度大于第二粒度。
[0016]可选地,第一确定单元可被配置为:分别确定所述至少一个音频中的每个音频的音高序列和参考音高序列之间的平均音高距离;根据所述至少一个音频中的每个音频的平均音高距离分别确定所述至少一个音频中的每个音频的音高评估结果。
[0017]可选地,第一确定单元可被配置为:分别确定所述至少一个音频中的每个音频的
音高序列和参考音高序列之间的相似度距离和相对序列偏移;基于所述至少一个音频中的每个音频的相似度距离分别确定所述至少一个音频中的每个音频的音准评估结果;基于所述至少一个音频中的每个音频的相对序列偏移分别确定所述至少一个音频中的每个音频的节奏评估结果。
[0018]可选地,第一确定单元可被配置为:分别对所述至少一个音频中的每个音频的音高序列和参考音高序列执行动态时间规整,得到所述至少一个音频中的每个音频的音高序列和参考音高序列之间的相似度距离和相对序列偏移。
[0019]可选地,第二确定单元可被配置为:分别确定所述至少一个音频中的每个音频的音高评估结果、音准评估结果以及节奏评估结果的平均值;将所述至少一个音频中的每个音频的所述平均值分别确定为所述至少一个音频中的每个音频的评估结果。
[0020]可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频评估方法,其特征在于,包括:对至少一个音频进行基频检测,得到所述至少一个音频的音高序列;基于评估模式对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行序列对齐处理,并将所述至少一个音频中的每个音频的互相对齐的音高序列和参考音高序列作为所述至少一个音频中的每个音频的音高序列和参考音高序列;基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果;基于所述至少一个音频的音高评估结果、音准评估结果以及节奏评估结果确定所述至少一个音频的评估结果。2.根据权利要求1所述的音频评估方法,其特征在于,基于评估模式对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行序列对齐处理,包括:当评估模式是第一评估模式时,对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行第一粒度的序列对齐处理;当评估模式是第二评估模式时,对所述至少一个音频中的每个音频的音高序列和参考音高序列分别执行第二粒度的序列对齐处理,其中,第一粒度大于第二粒度。3.根据权利要求1所述的音频评估方法,其特征在于,基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音高评估结果,包括:分别确定所述至少一个音频中的每个音频的音高序列和参考音高序列之间的平均音高距离;根据所述至少一个音频中的每个音频的平均音高距离分别确定所述至少一个音频中的每个音频的音高评估结果。4.根据权利要求1所述的音频评估方法,其特征在于,基于所述至少一个音频的音高序列和参考音高序列确定所述至少一个音频的音准评估结果以及节奏评估结果,包括:分别确定所述至少一个音频中的每个音频的音高序列和参考音高序列之间的相似度距离和相对序列偏移;基于所述至少一个音频中的每个音频的相似度距离分别确定所述至少一个音频中的每个音频的音准评估结果;基于所述至少一个音频中的每个音频的相对序列偏移分别确定所述至少一个音频中的每个音频的节奏评估结果。5.根据权利要求4所述的音频评估方法...

【专利技术属性】
技术研发人员:李子涵李楠张晨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1