音频的识别方法及系统技术方案

技术编号:18444865 阅读:17 留言:0更新日期:2018-07-14 10:21
本发明专利技术实施例涉及一种音频的识别方法及系统。包括:建立数据库,所述数据库包括多个音频指纹,所述音频指纹包括多个子指纹,所述多个音频指纹分别对应有音频文件,所述音频文件包括歌曲信息;确定待识别音频文件的目标音频指纹,所述目标音频指纹包括多个目标子指纹;将所述目标子指纹与所述数据库中的子指纹进行匹配,确定所述多个音频指纹中的每个与所述目标音频指纹的相关度;根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。可以针对各种格式音频文件根据音频文件的音频指纹来标识歌曲,即使更改歌曲的歌手名、专辑名等信息,音频指纹也是不会改变,识别准确率更高。

Audio recognition method and system

The embodiment of the invention relates to an audio recognition method and a system. Including: establishing a database, the database includes a plurality of audio fingerprints, the audio fingerprint includes a plurality of sub fingerprints, and the multiple audio fingerprints correspond to audio files, the audio files include song information, the target audio fingerprint of the audio files to be identified, and the target audio fingerprint includes a plurality of targets. The sub fingerprint of the target sub fingerprint is matched with the subfingerprint of the database to determine the correlation degree of each of the multiple audio fingerprints with the target audio fingerprint, and the selected songs are selected in the song information corresponding to the plurality of audio fingerprints according to the correlation degree corresponding to the multiple audio fingerprints. The song information. The audio files of various formats can be identified according to the audio fingerprint of the audio files. Even if the singer's name and album name are changed, the audio fingerprint will not change, and the recognition accuracy is higher.

【技术实现步骤摘要】
音频的识别方法及系统
本专利技术涉及音频数据处理
,尤其涉及一种音频的识别方法及系统。
技术介绍
对于音频文件一般包括用于存储歌手、标题、专辑名称、年代以及风格等标识信息的数据段,例如,对于MP3格式的音频文件,一般在该MP3音频文件的ID3信息中存储标识信息。在播放音频文件时,通常通过读取存储有标识信息的数据段中的标识信息,将该标识信息显示在播放界面,提供给用户。但是,随着技术的不断进步,出于为了规避版权等等原因,可轻易的对音频文件中存储标识信息的数据段进行修改或者删除。对于这类音频文件,在进行播放时,将会出现无法正确识别歌曲的情况,这势必会影响歌曲的欣赏体验。
技术实现思路
本专利技术实施例提供了一种音频指纹的生成方法及系统。通过提取音频文件中的取出并计算得到的一串标识符作为音频文件的音频指纹,以此来标识歌曲,可在ID3信息等改变后,依然可以正确识别歌曲。一方面,本专利技术实施例提供了一种音频的识别方法。包括:建立数据库,所述数据库包括多个音频指纹,所述音频指纹包括多个子指纹,所述多个音频指纹分别对应有音频文件,所述音频文件包括歌曲信息;确定待识别音频文件的目标音频指纹,所述目标音频指纹包括多个目标子指纹;将所述目标子指纹与所述数据库中的子指纹进行匹配,确定所述多个音频指纹中的每个与所述目标音频指纹的相关度;根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。可选地,所述多个音频指纹中的每个与所述目标音频指纹的相关度至少包括下述一项或多项:所述多个音频指纹中的每个对应的多个子指纹与所述多个目标子指纹匹配成功的个数;匹配成功的子指纹在所述目标音频指纹与所述多个音频指纹中的每个的位差异程度;所述多个音频指纹中的每个对应的音频文件的时长;所述多个音频指纹中的每个对应的音频文件的码率;所述多个音频指纹中的每个对应的音频文件与所述待识别音频文件的歌曲信息的相似度。可选地,所述确定所述多个音频指纹中的每个与所述目标音频指纹的相关度包括:确定所述多个音频指纹中的每个对应的多个子指纹与所述目标子指纹匹配成功的个数。可选地,根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息包括:根据所述多个音频指纹中的每个匹配成功的个数,选择所述多个音频指纹中符合预制规则的多个音频指纹;确定所述目标音频指纹与所述符合预制规则的多个音频指纹中的每个的位差异程度;根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。可选地,所述根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息包括:根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的音频文件中选择多个备选音频文件;基于音频文件时长以及码率对所述多个备选歌曲进行筛选;根据多个筛选后的备选音频文件的歌曲信息分别计算权重信息;根据所述权重信息,在所述多个筛选后的备选音频文件的歌曲信息选择所述待识别歌曲的歌曲信息。另一方面,本专利技术实施例提供了一种音频的识别系统。包括:建立单元,用于建立数据库,所述数据库包括多个音频指纹,所述音频指纹包括多个子指纹,所述多个音频指纹分别对应有音频文件,所述音频文件包括歌曲信息;确定单元,用于确定待识别音频文件的目标音频指纹,所述目标音频指纹包括多个目标子指纹;匹配单元,用于将所述目标子指纹与所述数据库中的子指纹进行匹配,确定所述多个音频指纹中的每个与所述目标音频指纹的相关度;选择单元,用于根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。可选地,所述多个音频指纹中的每个与所述目标音频指纹的相关度至少包括下述一项或多项:所述多个音频指纹中的每个对应的多个子指纹与所述多个目标子指纹匹配成功的个数;匹配成功的子指纹在所述目标音频指纹与所述多个音频指纹中的每个的位差异程度;所述多个音频指纹中的每个对应的音频文件的时长;所述多个音频指纹中的每个对应的音频文件的码率;所述多个音频指纹中的每个对应的音频文件与所述待识别音频文件的歌曲信息的相似度。可选地,所述匹配单元还用于,确定所述多个音频指纹中的每个对应的多个子指纹与所述目标子指纹匹配成功的个数。可选地,所述匹配单元还用于,根据所述多个音频指纹中的每个匹配成功的个数,选择所述多个音频指纹中符合预制规则的多个音频指纹;确定所述目标音频指纹与所述符合预制规则的多个音频指纹中的每个的位差异程度;根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。可选地,所述匹配单元还用于,根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的音频文件中选择多个备选音频文件;基于音频文件时长以及码率对所述多个备选歌曲进行筛选;根据多个筛选后的备选音频文件的歌曲信息分别计算权重信息;根据所述权重信息,在所述多个筛选后的备选音频文件的歌曲信息选择所述待识别歌曲的歌曲信息。通过本专利技术实施例,可以针对各种格式音频文件根据音频文件的音频指纹来标识歌曲,即使更改歌曲的歌手名、专辑名等信息,音频指纹也是不会改变,识别准确率更高。附图说明图1为本专利技术实施例提供的一种音频指纹的生成方法的流程图;图2为本专利技术实施例提供的一种在音频文件数据库中添加音频指纹的方法流程图;图3为本专利技术实施例提供的一种音频的识别方法的流程图;图4为本专利技术实施例提供的一个示例;图5为本专利技术实施例提供的另一个示例;图6为本专利技术实施例提供的另一种音频的识别方法的流程图;图7为本专利技术实施例提供的一种音频的识别系统结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的实施例通过对不同任意版本的音频文件转换成标准格式,根据该标准格式的音频文件去提取,所以不会出现由于音频文件的多版本问题造成的采样标准不统一的问题,同时,在计算指纹的过程中,通过降采样,傅里叶变换方式,采样了歌曲部分指纹,既满足了各种音频文件的指纹生成的唯一性,也为提高识别该音频文件的指纹效率提供了基础。为便于对本专利技术实施例的理解,下面将结合附图以具体实施例作进一步的解释说明,实施例并不构成对本专利技术实施例的限定。图1为本专利技术实施例提供的一种音频指纹的生成方法的流程图。如图1所示,该方法具体包括:S110,根据第一音频文件截取基于PCM编码的第二音频文件,该第二音频文件为在第一音频文件第一时间处截取的音频文件。第一音频文件为标准格式的音频文件,该第一音频文件的格式可以为WMA等通用的音频文件的格式。源音频文件,也就是需要利用音频指纹进行标识的音频文件,可能存在多个版本多种格式,首先将源音频文件转换为标准格式的音频文件,使得本文档来自技高网...

【技术保护点】
1.一种音频的识别方法,其特征在于,包括:建立数据库,所述数据库包括多个音频指纹,所述音频指纹包括多个子指纹,所述多个音频指纹分别对应有音频文件,所述音频文件包括歌曲信息;确定待识别音频文件的目标音频指纹,所述目标音频指纹包括多个目标子指纹;将所述目标子指纹与所述数据库中的子指纹进行匹配,确定所述多个音频指纹中的每个与所述目标音频指纹的相关度;根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。

【技术特征摘要】
1.一种音频的识别方法,其特征在于,包括:建立数据库,所述数据库包括多个音频指纹,所述音频指纹包括多个子指纹,所述多个音频指纹分别对应有音频文件,所述音频文件包括歌曲信息;确定待识别音频文件的目标音频指纹,所述目标音频指纹包括多个目标子指纹;将所述目标子指纹与所述数据库中的子指纹进行匹配,确定所述多个音频指纹中的每个与所述目标音频指纹的相关度;根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。2.根据权利要求1所述的方法,其特征在于,所述多个音频指纹中的每个与所述目标音频指纹的相关度至少包括下述一项或多项:所述多个音频指纹中的每个对应的多个子指纹与所述多个目标子指纹匹配成功的个数;匹配成功的子指纹在所述目标音频指纹与所述多个音频指纹中的每个的位差异程度;所述多个音频指纹中的每个对应的音频文件的时长;所述多个音频指纹中的每个对应的音频文件的码率;所述多个音频指纹中的每个对应的音频文件与所述待识别音频文件的歌曲信息的相似度。3.根据权利要求1所述的方法,其特征在于,所述确定所述多个音频指纹中的每个与所述目标音频指纹的相关度包括:确定所述多个音频指纹中的每个对应的多个子指纹与所述目标子指纹匹配成功的个数。4.根据权利要求3所述的方法,其特征在于,根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息包括:根据所述多个音频指纹中的每个匹配成功的个数,选择所述多个音频指纹中符合预制规则的多个音频指纹;确定所述目标音频指纹与所述符合预制规则的多个音频指纹中的每个的位差异程度;根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。5.根据权利要求4所述的方法,其特征在于,所述根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息包括:根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的音频文件中选择多个备选音频文件;基于音频文件时长以及码率对所述多个备选歌曲进行筛选;根据多个筛选后的备选音频文件的歌曲信息分别计...

【专利技术属性】
技术研发人员:马明
申请(专利权)人:北京酷我科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1