音频相似度检测方法、装置、存储介质及计算机设备制造方法及图纸

技术编号：19906163 阅读：24 留言：0更新日期：2018-12-26 03:45

本发明专利技术实施例公开了一种音频相似度检测方法、装置、存储介质及计算机设备，本发明专利技术实施例可以获取待检测音频；从所述待检测音频中筛选出满足预设条件的音频，并根据筛选出的音频获取所述待检测音频的特征序列；获取基准音频的基准特征序列；获取所述待检测音频的特征序列，与所述基准音频的基准特征序列之间的相似距离；根据所述相似距离确定所述待检测音频和基准音频之间的相似度。该方案可以将待检测音频中的干扰音频进行过滤及筛选出所需的音频特征，以及可以减小多种因素对相似度检测结果的影响，提高了音频相似度检测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
音频相似度检测方法、装置、存储介质及计算机设备
本专利技术涉及数据处理
，具体涉及一种音频相似度检测方法、装置、存储介质及计算机设备。
技术介绍
随着科技的发展，人们的生活越来越丰富，例如，用户不仅可以欣赏音乐及影视等音频，还可以模仿该音频进行娱乐，此时需要对用户模仿的音频与原始音频进行比较，以评估模仿的相似度。现有技术中，以模仿歌曲为例，在检测音频相似度的过程中，首先，采集用户模仿的音频，以及混合有伴奏音频的原唱音频，然后直接计算用户模仿的音频和原唱音频之间的相似度。然而，由于原唱音频和用户模仿的音频受到较多因素的影响，这样直接计算相似度会产生较大的误差，导致得到的相似度准确性较低。
技术实现思路
本专利技术实施例提供一种音频相似度检测方法、装置、存储介质及计算机设备，旨在提高音频相似度检测的准确性。为解决上述技术问题，本专利技术实施例提供以下技术方案：一种音频相似度检测方法，包括：获取待检测音频；从所述待检测音频中筛选出满足预设条件的音频，并根据筛选出的音频获取所述待检测音频的特征序列；获取基准音频的基准特征序列；获取所述待检测音频的特征序列，与所述基准音频...

【技术保护点】
1.一种音频相似度检测方法，其特征在于，包括：获取待检测音频；从所述待检测音频中筛选出满足预设条件的音频，并根据筛选出的音频获取所述待检测音频的特征序列；获取基准音频的基准特征序列；获取所述待检测音频的特征序列，与所述基准音频的基准特征序列之间的相似距离；根据所述相似距离确定所述待检测音频和基准音频之间的相似度。

【技术特征摘要】
1.一种音频相似度检测方法，其特征在于，包括：获取待检测音频；从所述待检测音频中筛选出满足预设条件的音频，并根据筛选出的音频获取所述待检测音频的特征序列；获取基准音频的基准特征序列；获取所述待检测音频的特征序列，与所述基准音频的基准特征序列之间的相似距离；根据所述相似距离确定所述待检测音频和基准音频之间的相似度。2.根据权利要求1所述的音频相似度检测方法，其特征在于，所述从所述待检测音频中筛选出满足预设条件的音频，并根据筛选出的音频获取所述待检测音频的特征序列，包括：对所述待检测音频进行预处理，得到预处理后的音频；获取所述预处理后的音频的能量谱；根据所述能量谱，从所述预处理后的音频中筛选出满足预设条件的音频，并将筛选出的音频对应的频率序列设置为所述待检测音频的特征序列。3.根据权利要求2所述的音频相似度检测方法，其特征在于，所述对所述待检测音频进行预处理，得到预处理后的音频，包括：按照预设采样策略对所述待检测音频进行采样，得到采样后的音频；按照预设分帧策略对所述采样后的音频进行分帧处理，得到分帧后的音频；对所述分帧后的音频进行加窗处理，得到离散时域的预处理后的音频。4.根据权利要求2所述的音频相似度检测方法，其特征在于，所述获取所述预处理后的音频的能量谱，包括：对所述预处理后的音频进行积分变换，得到所述预处理后的音频对应的频谱；根据所述频谱确定所述预处理后的音频的能量谱。5.根据权利要求2所述的音频相似度检测方法，其特征在于，所述根据所述能量谱，从所述预处理后的音频中筛选出满足预设条件的音频，包括：根据所述能量谱获取所述待检测音频的声音强度；从所述待检测音频中筛选出声音强度大于预设阈值的音频，得到声音强度满足所述预设条件的音频。6.根据权利要求5所述的音频相似度检测方法，其特征在于，所述从所述待检测音频中筛选出声音强度大于预设阈值的音频，得到声音强度满足所述预设条件的音频，包括：将所述待检测音频的声音强度标准化到预设声音强度范围，得到声音强度标准化音频；从所述声音强度标准化音频中筛选出声音强度大于预设阈值的音频，得到声音强度满足所述预设条件的音频。7.根据权利要求1所述的音频相似度检测方法，其特征在于，当所述基准音频中包括目标基准音频和干扰音频时，所述获取基准音频的基准特征序列，包括：获取所述目标基准音频的第一均方根能量均值，以及获取所述干扰音频的第二均方根能量均值；获取所述目标基准音频的第一能量谱，以及获取所述干扰音频的第二能量谱；根据所述第一能量谱、第一均方根能量均值、第二均方根能量均值及第二能量谱，对所述基准音频进行优化，得到优化后的基准音频；获取所述优化后的基准音频的基准特征序列。8.根据权利要求7所述的音频相似度检测方法，其特征在于，所述获取所述目标基准音频的第一均方根能量均值，以及获取所述干扰音频的第二均方根能量均值，包括：确定所述目标基准音频的第一均方根能量，以及确定所述干扰音频的第二均方根能量；获取所述目标基准音频的第一帧数和第一帧长，以及获取所述干扰音频的第二帧数和第二帧长；根据所述第一均方根能量、第一帧数和第一帧长确定所述目标基准音频的第一均方根能量均值，以及根据所述第二均方根能量、第二帧数和第二帧长确定所述干扰音频的第二均方根能量均值。9.根据权利要求1至8任一项所述的音频相似度检测方法，其特征在于，所述获取所述待检测音频的特征序列，与所述基准音频的基准特征序列之间的相似距离，包括：按照预设编码策略对所述待检测音频的特征序列进行编码，得到第一编码后的特征序列，以及按照所述预设编...

【专利技术属性】
技术研发人员：陈均，赵旭峰，沈锦龙，樊征，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人