音频相似度检测方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:19906163 阅读:20 留言:0更新日期:2018-12-26 03:45
本发明专利技术实施例公开了一种音频相似度检测方法、装置、存储介质及计算机设备,本发明专利技术实施例可以获取待检测音频;从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列;获取基准音频的基准特征序列;获取所述待检测音频的特征序列,与所述基准音频的基准特征序列之间的相似距离;根据所述相似距离确定所述待检测音频和基准音频之间的相似度。该方案可以将待检测音频中的干扰音频进行过滤及筛选出所需的音频特征,以及可以减小多种因素对相似度检测结果的影响,提高了音频相似度检测的准确性。

【技术实现步骤摘要】
音频相似度检测方法、装置、存储介质及计算机设备
本专利技术涉及数据处理
,具体涉及一种音频相似度检测方法、装置、存储介质及计算机设备。
技术介绍
随着科技的发展,人们的生活越来越丰富,例如,用户不仅可以欣赏音乐及影视等音频,还可以模仿该音频进行娱乐,此时需要对用户模仿的音频与原始音频进行比较,以评估模仿的相似度。现有技术中,以模仿歌曲为例,在检测音频相似度的过程中,首先,采集用户模仿的音频,以及混合有伴奏音频的原唱音频,然后直接计算用户模仿的音频和原唱音频之间的相似度。然而,由于原唱音频和用户模仿的音频受到较多因素的影响,这样直接计算相似度会产生较大的误差,导致得到的相似度准确性较低。
技术实现思路
本专利技术实施例提供一种音频相似度检测方法、装置、存储介质及计算机设备,旨在提高音频相似度检测的准确性。为解决上述技术问题,本专利技术实施例提供以下技术方案:一种音频相似度检测方法,包括:获取待检测音频;从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列;获取基准音频的基准特征序列;获取所述待检测音频的特征序列,与所述基准音频的基准特征序列之间的相似距离;根据所述相似距离确定所述待检测音频和基准音频之间的相似度。一种音频相似度检测装置,包括:音频获取单元,用于获取待检测音频;筛选单元,用于从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列;特征获取单元,用于获取基准音频的基准特征序列;距离获取单元,用于获取所述待检测音频的特征序列,与所述基准音频的基准特征序列之间的相似距离;确定单元,用于根据所述相似距离确定所述待检测音频和基准音频之间的相似度。可选地,所述筛选单元包括:处理子单元,用于对所述待检测音频进行预处理,得到预处理后的音频;获取子单元,用于获取所述预处理后的音频的能量谱;筛选子单元,用于根据所述能量谱,从所述预处理后的音频中筛选出满足预设条件的音频,并将筛选出的音频对应的频率序列设置为所述待检测音频的特征序列。可选地,所述处理子单元具体用于:按照预设采样策略对所述待检测音频进行采样,得到采样后的音频;按照预设分帧策略对所述采样后的音频进行分帧处理,得到分帧后的音频;对所述分帧后的音频进行加窗处理,得到离散时域的预处理后的音频。可选地,所述获取子单元具体用于:对所述预处理后的音频进行积分变换,得到所述预处理后的音频对应的频谱;根据所述频谱确定所述预处理后的音频的能量谱。可选地,所述筛选子单元包括:获取模块,用于根据所述能量谱获取所述待检测音频的声音强度;筛选模块,用于从所述待检测音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足预设条件的音频。可选地,所述筛选模块具体用于:将所述待检测音频的声音强度标准化到预设声音强度范围,得到声音强度标准化音频;从所述声音强度标准化音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足所述预设条件的音频。可选地,当所述基准音频中包括目标基准音频和干扰音频时,所述特征获取单元包括:均值获取子单元,用于获取所述目标基准音频的第一均方根能量均值,以及获取所述干扰音频的第二均方根能量均值;能量谱获取子单元,用于获取所述目标基准音频的第一能量谱,以及获取所述干扰音频的第二能量谱;优化子单元,用于根据所述第一能量谱、第一均方根能量均值、第二均方根能量均值及第二能量谱,对所述基准音频进行优化,得到优化后的基准音频;特征获取子单元,用于获取所述优化后的基准音频的基准特征序列。可选地,所述均值获取子单元具体用于:确定所述目标基准音频的第一均方根能量,以及确定所述干扰音频的第二均方根能量;获取所述目标基准音频的第一帧数和第一帧长,以及获取所述干扰音频的第二帧数和第二帧长;根据所述第一均方根能量、第一帧数和第一帧长确定所述目标基准音频的第一均方根能量均值,以及根据所述第二均方根能量、第二帧数和第二帧长确定所述干扰音频的第二均方根能量均值。可选地,所述距离获取单元包括:编码子单元,用于按照预设编码策略对所述待检测音频的特征序列进行编码,得到第一编码后的特征序列,以及按照所述预设编码策略对所述基准音频的基准特征序列进行编码,得到第二编码后的特征序列;第一确定子单元,用于确定所述第一编码后的特征序列和第二编码后的特征序列之间的相似距离。可选地,所述编码子单元具体用于:按照预设编码策略将所述待检测音频的特征序列中,每相邻两个特征值进行大小比较;当相邻两个特征值中前一个特征值小于后一个特征值时,将所述待检测音频的特征序列编码为第一编码值,以及,当相邻两个特征值中前一个特征值等于后一个特征值时,将所述待检测音频的特征序列编码为第二编码值;以及,当相邻两个特征值中前一个特征值大于后一个特征值时,将所述待检测音频的特征序列编码为第三编码值;基于第一编码值、第二编码值和/或第三编码值生成第一编码后的特征序列。可选地,所述相似距离至少包括编辑距离、欧几里得距离和汉明距离,所述第一确定子单元具体用于:至少确定所述第一编码后的特征序列和第二编码后的特征序列之间的编辑距离、欧几里得距离和汉明距离;对所述编辑距离、欧几里得距离和汉明距离分别进行归一化,得到相似距离。可选地,所述确定单元包括:构建子单元,用于构建编辑距离、欧几里得距离和汉明距离中各距离与子相似度之间的仿射函数;确定子单元,用于根据各距离对应的仿射函数分别确定各距离对应的子相似度;第三确定子单元,用于根据所述子相似度确定所述待检测音频和基准音频之间的相似度。可选地,所述第三确定子单元具体用于:为所述编辑距离的子相似度设置第一权重值,及为所述汉明距离的子相似度设置第二权重值;将所述欧几里得距离的子相似度设置为惩罚项;根据所述第一权重值、第二权重值和惩罚项,确定所述待检测音频和基准音频之间的相似度。可选地,所述音频相似度检测装置还包括:资源转移单元,用于当所述待检测音频和基准音频之间的相似度大于预设相似度阈值时,执行虚拟资源转移操作,和/或显示所述待检测音频的相似度检测结果的相关信息。可选地,所述音频相似度检测装置还包括:解锁单元,用于当所述待检测音频和基准音频之间的相似度大于预设相似度阈值时,执行解开音频锁操作。一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本专利技术实施例提供的任一种音频相似度检测方法。一种计算机设备,包括存储器和处理器,所述存储器存储有确定机程序,所述确定机程序被所述处理器执行时,使得所述处理器执行本专利技术实施例提供的任一种音频相似度检测方法。本专利技术实施例可以获取待检测音频,以及从该待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取待检测音频的特征序列,从而可以将待检测音频中的干扰音频进行过滤及筛选出所需的音频特征,以及获取基准音频的基准特征序列;然后,获取待检测音频的特征序列,与基准音频的基准特征序列之间的相似距离,例如编辑距离、欧几里得距离和汉明距离等,该相似距离可以减小多种因素对相似度检测结果的影响,此时可以根据相似距离确定待检测音频和基准音频之间的相似度,提高了音频相似度检测的准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面本文档来自技高网...

【技术保护点】
1.一种音频相似度检测方法,其特征在于,包括:获取待检测音频;从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列;获取基准音频的基准特征序列;获取所述待检测音频的特征序列,与所述基准音频的基准特征序列之间的相似距离;根据所述相似距离确定所述待检测音频和基准音频之间的相似度。

【技术特征摘要】
1.一种音频相似度检测方法,其特征在于,包括:获取待检测音频;从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列;获取基准音频的基准特征序列;获取所述待检测音频的特征序列,与所述基准音频的基准特征序列之间的相似距离;根据所述相似距离确定所述待检测音频和基准音频之间的相似度。2.根据权利要求1所述的音频相似度检测方法,其特征在于,所述从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列,包括:对所述待检测音频进行预处理,得到预处理后的音频;获取所述预处理后的音频的能量谱;根据所述能量谱,从所述预处理后的音频中筛选出满足预设条件的音频,并将筛选出的音频对应的频率序列设置为所述待检测音频的特征序列。3.根据权利要求2所述的音频相似度检测方法,其特征在于,所述对所述待检测音频进行预处理,得到预处理后的音频,包括:按照预设采样策略对所述待检测音频进行采样,得到采样后的音频;按照预设分帧策略对所述采样后的音频进行分帧处理,得到分帧后的音频;对所述分帧后的音频进行加窗处理,得到离散时域的预处理后的音频。4.根据权利要求2所述的音频相似度检测方法,其特征在于,所述获取所述预处理后的音频的能量谱,包括:对所述预处理后的音频进行积分变换,得到所述预处理后的音频对应的频谱;根据所述频谱确定所述预处理后的音频的能量谱。5.根据权利要求2所述的音频相似度检测方法,其特征在于,所述根据所述能量谱,从所述预处理后的音频中筛选出满足预设条件的音频,包括:根据所述能量谱获取所述待检测音频的声音强度;从所述待检测音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足所述预设条件的音频。6.根据权利要求5所述的音频相似度检测方法,其特征在于,所述从所述待检测音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足所述预设条件的音频,包括:将所述待检测音频的声音强度标准化到预设声音强度范围,得到声音强度标准化音频;从所述声音强度标准化音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足所述预设条件的音频。7.根据权利要求1所述的音频相似度检测方法,其特征在于,当所述基准音频中包括目标基准音频和干扰音频时,所述获取基准音频的基准特征序列,包括:获取所述目标基准音频的第一均方根能量均值,以及获取所述干扰音频的第二均方根能量均值;获取所述目标基准音频的第一能量谱,以及获取所述干扰音频的第二能量谱;根据所述第一能量谱、第一均方根能量均值、第二均方根能量均值及第二能量谱,对所述基准音频进行优化,得到优化后的基准音频;获取所述优化后的基准音频的基准特征序列。8.根据权利要求7所述的音频相似度检测方法,其特征在于,所述获取所述目标基准音频的第一均方根能量均值,以及获取所述干扰音频的第二均方根能量均值,包括:确定所述目标基准音频的第一均方根能量,以及确定所述干扰音频的第二均方根能量;获取所述目标基准音频的第一帧数和第一帧长,以及获取所述干扰音频的第二帧数和第二帧长;根据所述第一均方根能量、第一帧数和第一帧长确定所述目标基准音频的第一均方根能量均值,以及根据所述第二均方根能量、第二帧数和第二帧长确定所述干扰音频的第二均方根能量均值。9.根据权利要求1至8任一项所述的音频相似度检测方法,其特征在于,所述获取所述待检测音频的特征序列,与所述基准音频的基准特征序列之间的相似距离,包括:按照预设编码策略对所述待检测音频的特征序列进行编码,得到第一编码后的特征序列,以及按照所述预设编...

【专利技术属性】
技术研发人员:陈均赵旭峰沈锦龙樊征
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1