【技术实现步骤摘要】
一种基于音频指纹的听歌识曲方法、系统及音频设备
本专利技术涉及语音通信
,特别是一种基于音频指纹的听歌识曲方法及其应用该方法的系统和音频设备。
技术介绍
听歌识曲功能在国内众多的音乐类APP火热上线,比如网易云音乐,QQ音乐,当用户听到自己感兴趣的音频时,可以通过这个功能识别当前环境里正在播放的歌曲名字。实现“听歌识曲”一般需要以下两个要素:1.对歌曲进行特征提取:一般来说,鲁棒性高并且容易分别的特征存在于音频文件的频谱;从音乐的角度来讲,一首歌曲的旋律,节奏,韵律都属于这类特征;2.构建歌曲库:对歌曲的识别应该是在一个音乐歌曲库里进行搜索,选择和待识别歌曲最相似的作为匹配歌曲输出。但是,目前的听歌识曲功能存在识别速度慢,识别效果较差的问题,而用户希望得到的是高效又精准的结果。此时就需要通过新的音频指纹技术来进行歌曲的识别。
技术实现思路
本专利技术为解决上述问题,提供了一种基于音频指纹的听歌识曲方法、系统及音频设备通过将录制音频指纹与模板音频指纹数据库中的模板音频指 ...
【技术保护点】
1.一种基于音频指纹的听歌识曲方法,其特征在于,包括以下步骤:/n收集歌曲音频作为模板音频,并获取所述模板音频对应的频谱图,从所述频谱图中提取峰值点作为所述模板音频对应的模板音频指纹,根据所述模板音频和所述模板音频指纹进行构建歌曲音频的模板音频指纹数据库;/n获取当前音乐的录制音频,并获取所述录制音频对应的频谱图,从所述频谱图中提取峰值点作为所述录制音频对应的录制音频指纹;/n将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配;/n若匹配度达到设定的阈值,则输出所述录制音频对应匹配的歌曲音频。/n
【技术特征摘要】
1.一种基于音频指纹的听歌识曲方法,其特征在于,包括以下步骤:
收集歌曲音频作为模板音频,并获取所述模板音频对应的频谱图,从所述频谱图中提取峰值点作为所述模板音频对应的模板音频指纹,根据所述模板音频和所述模板音频指纹进行构建歌曲音频的模板音频指纹数据库;
获取当前音乐的录制音频,并获取所述录制音频对应的频谱图,从所述频谱图中提取峰值点作为所述录制音频对应的录制音频指纹;
将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配;
若匹配度达到设定的阈值,则输出所述录制音频对应匹配的歌曲音频。
2.根据权利要求1所述的基于音频指纹的听歌识曲方法,其特征在于:将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配,包括:
对所述录制音频指纹对应的频谱图中的峰值点和所述模板音频指纹对应的频谱图中的峰值点按照时间维度的顺序进行音频指纹的匹配;或者,
对所述录制音频指纹对应的频谱图中的峰值点和/或所述模板音频指纹对应的频谱图中的峰值点进行分组,得到峰值点组合,并计算每个峰值点组合对应的哈希值,根据所述哈希值进行音频指纹的匹配。
3.根据权利要求2所述的基于音频指纹的听歌识曲方法,其特征在于:所述峰值点组合包括M个峰值点和一个锚点,所述锚点的频率小于或等于所述峰值点的频率,所述锚点用于获取所述峰值点组合中的每个峰值点相对所述锚点的时间差;根据所述峰值点的频率值、所述锚点的频率值、所述峰值点与所述锚点之间的时间差进行创建所述峰值点对应的三维数组;计算所述三维数组的哈希值,作为所述峰值点的哈希值。
4.根据权利要求3所述的基于音频指纹的听歌识曲方法,其特征在于:根据所述哈希值进行音频指纹的匹配,是通过对所述峰值点组合中的每个峰值点的哈希值进行匹配实现音频指纹的匹配;或者,是根据每个峰值点的哈希值计算所述峰值点组合的总和哈希值,通过对所述峰值点组合的总和哈希值进行匹配实现音频指纹的匹配;或者,是根据每个峰值点的哈希值计算最大哈希值,将该最大哈希值作为所述峰值点组合的代表哈希值,通过对所述峰值点组合的代表哈希值进行匹配实现音频指纹的匹配。
5.根据权利要求1所述的基于音频指纹的听歌识曲方法,其特征在于:将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配,进一步包括以下匹配步骤:
从所述模板音频指纹数据库中提取任一模板音频指纹,对所述当前音乐的录制音频指纹和所述模板音频指纹数据库中的模板音频指纹分别建立对应的音频指纹哈希表;
根据所述音频指纹哈希表确定所述任一模板音频指纹与所述当前音乐的录制音频指纹的相似度;
若所述相似度小...
【专利技术属性】
技术研发人员:曾志先,肖龙源,李稀敏,蔡振华,刘晓葳,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。