音频处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:21550111 阅读:20 留言:0更新日期:2019-07-06 22:48
本发明专利技术实施例公开了一种音频处理的方法、装置、电子设备及存储介质,包括:提取目标音频的色度特征信息,所述色度特征信息包括多个音频段的特征向量,根据所述多个音频段的特征向量计算所述多个音频段之间的相似度,根据所述相似度从所述多个音频段中获取重复音频段集合,所述重复音频段集合包括多个重复音频段,根据所述重复音频段集合确定所述目标音频的副歌;可提高提取副歌的准确性。

Audio Processing Method, Device, Electronic Equipment and Storage Media

【技术实现步骤摘要】
音频处理方法、装置、电子设备及存储介质
本专利技术涉及多媒体数据
,尤其涉及一种音频处理方法,一种音频处理装置,一种电子设备,以及一种存储介质。
技术介绍
通常,一首歌曲由前奏、主歌、副歌及间奏组成。其中,副歌的旋律和歌词都非常相似,形成了歌曲中通常最容易被人记忆的部分,可为听者提供一种较好的听觉效果;因此,副歌被称为一首歌曲当中最具代表性和最吸引人的部分,并被广泛应用于音乐搜索、彩铃制作或音乐试听等场景中。由于一首歌曲音频数据的复杂性和不同歌曲之间的差异性为副歌提取带来很多的困难。现有技术中通常采用文本分析的方法提取歌曲的副歌,该方法主要依赖于歌曲的歌词之间的关系;实践发现,较多歌曲不具备歌词,导致该方法的准确度较低,不能达到用户预期的效果。因此,如何能够较准确地提取副歌是当前亟待解决的问题。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种音频处理方法、装置、电子设备及存储介质,可基于音频的色度特征信息提取副歌,以提高提取副歌的准确度。一方面,本专利技术实施例提供一种音频处理方法,该方法包括:提取目标音频的色度特征信息,所述色度特征信息包括多个音频段的特征向量;根据所述多个音频段的特征向量计算所述多个音频段之间的相似度;根据所述相似度从所述多个音频段中获取重复音频段集合,所述重复音频段集合包括多个重复音频段;根据所述重复音频段集合确定所述目标音频的副歌。一方面,本专利技术实施例提供一种音频处理装置,该装置包括:提取单元,用于提取目标音频的色度特征信息,所述色度特征信息包括多个音频段的特征向量;计算单元,用于根据所述多个音频段的特征向量计算所述多个音频段之间的相似度;获取单元,用于根据所述相似度从所述多个音频段中获取重复音频段集合,所述重复音频段集合包括多个重复音频段;确定单元,用于根据所述重复音频段集合确定所述目标音频的副歌。一方面,本专利技术实施例提供一种电子设备,包括:处理器和存储装置;所述存储装置存储有计算机程序指令,所述处理器调用所述计算机程序指令,用于执行如下步骤:提取目标音频的色度特征信息,所述色度特征信息包括多个音频段的特征向量;根据所述多个音频段的特征向量计算所述多个音频段之间的相似度;根据所述相似度从所述多个音频段中获取重复音频段集合,所述重复音频段集合包括多个重复音频段;根据所述重复音频段集合确定所述目标音频的副歌。一方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,该计算机程序指令被执行时,该方法包括:提取目标音频的色度特征信息,所述色度特征信息包括多个音频段的特征向量;根据所述多个音频段的特征向量计算所述多个音频段之间的相似度;根据所述相似度从所述多个音频段中获取重复音频段集合,所述重复音频段集合包括多个重复音频段;根据所述重复音频段集合确定所述目标音频的副歌。本专利技术实施例中,可以根据目标音频的多个音频段的特征向量确定音频段之间的相似度,根据相似度获取重复音频段,并根据重复音频段确定目标音频的副歌;音频段的特征向量用于描述音频段的色度特征信息(即音频的旋律),即可通过副歌的旋律的重复特性提取目标音频的副歌,可提高获取目标音频的副歌的准确度。且该方法不需要依赖目标音频对应歌曲的歌词及乐器数字接口信息,适应范围广泛,例如,可适用于具备歌词的歌曲的副歌提取,也可适用于不具备歌词的歌曲的副歌提取。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术的提供的一种音频处理方法的流程示意图;图2是本专利技术的提供的另一种音频处理方法的流程示意图;图3是本专利技术的提供的又一种音频处理方法的流程示意图;图4是本专利技术的提供的一种音频处理装置的结构示意图;图5是本专利技术的提供的又一种电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了提高副歌提取的准确度,本专利技术实施例提供一种音频处理方法,请参见图1,该方法可以应用于电子设备,该电子设备可以为智能手机、智能手表、平板电脑或服务器等设备,该方法可以包括步骤S101~S104。S101、提取目标音频的色度特征信息,该色度特征信息包括多个音频段的特征向量。为了提取目标音频的副歌,电子设备可以获取目标音频,例如,可以从本地数据库中获取目标音频,或者,从网络上在线拉取目标音频;其中,该目标音频可以为某歌曲的原唱音频或翻唱音频,原唱音频是指首次发表的歌曲由歌曲作者本人或与歌曲作者合作的人演唱该歌曲所生成的音频,翻唱音频是指已经发表歌曲由他人(即除歌曲作者本人和与歌曲作者合作的人)根据自己的风格重新演唱该歌曲所生成的音频。并提取该目标音频的色度chroma特征信息。其中,该色度特征信息包括多个音频段的特征向量,每个音频段的长度可以相同,也可以不相同,特征向量可以用于描述音频的旋律,更具体的用于描述根据该音频段的音高pitch值生成的二维图像特征;音高是指各种不同高低的声音,即音的高度,音的基本特征的一种。音高的大小是由振动频率决定的,两者具有正相关关系,即振动频率越高则音高越大,反之,振动频率越低则音高越小。S102、根据多个音频段的特征向量计算该多个音频段之间的相似度。由于目标音频的副歌的旋律(即色度特征)具有重复性,因此,副歌包括的音频段之间具有较高相似度。为了准确地提取目标音频的副歌,电子设备可以根据多个音频段的特征向量获取多个音频段之间的相似度。例如,可以按照预设距离算法计算多个音频段的特征向量之间的距离,预设距离算法可以包括欧式距离算法、曼哈顿距离算法、切比雪夫距离算法或马氏距离算法等等;根据多个音频段的特征向量之间的距离确定该多个音频段之间的相似度。其中,每两个音频段的特征向量之间的距离越大,表明两个音频段的色度特征之间的差异较大,即两个音频段的相似度较低;每两个音频段的特征向量之间的距离越小,表明两个音频段的色度特征之间的差异较小,即两个音频段的相似度较高。S103、根据该相似度从该多个音频段中获取重复音频段集合,重复音频段集合包括多个重复音频段。电子设备可以根据该相似度从该多个音频段中获取重复音频段集合,其中,该重复音频段集合包括多个重复音频段,该重复音频段可以是通过将相似度大于预设相似度阈值且具有相邻关系的每两个音频段进行合并得到。S104、根据重复音频段集合确定目标音频的副歌。电子设备可以根据重复音频段集合确定目标音频的副歌,具体的,可以对重复音频段集合中重复音频段进行筛选,并对筛选出重复音频段进行合并,得到目标音频的副歌。可通过目标音频的副歌的旋律的重复特性提取副歌,不需要依赖目标音频对应歌曲的歌词及乐器数字接口(MusicalInstrumentDigitalInterface,MIDI)信息,可提高获取目标音频的副歌的准确度;适应范本文档来自技高网...

【技术保护点】
1.一种音频处理方法,其特征在于,包括:提取目标音频的色度特征信息,所述色度特征信息包括多个音频段的特征向量;根据所述多个音频段的特征向量计算所述多个音频段之间的相似度;根据所述相似度从所述多个音频段中获取重复音频段集合,所述重复音频段集合包括多个重复音频段;根据所述重复音频段集合确定所述目标音频的副歌。

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:提取目标音频的色度特征信息,所述色度特征信息包括多个音频段的特征向量;根据所述多个音频段的特征向量计算所述多个音频段之间的相似度;根据所述相似度从所述多个音频段中获取重复音频段集合,所述重复音频段集合包括多个重复音频段;根据所述重复音频段集合确定所述目标音频的副歌。2.如权利要求1所述的方法,其特征在于,所述提取目标音频的色度特征信息,包括:对所述目标音频进行划分得到多个音频段;获取所述多个音频段中每个音频段的时频信息;对所述多个音频段中每个音频段的时频信息进行滤波处理,得到所述多个音频段中每个音频段的特征向量。3.如权利要求1所述的方法,其特征在于,所述根据所述多个音频段的特征向量计算所述多个音频之间的相似度,包括:计算所述多个音频段的特征向量之间的欧氏距离;根据所述欧氏距离确定所述多个音频段之间的相似度。4.如权利要求3所述的方法,其特征在于,所述根据所述相似度从所述多个音频段中获取重复音频段集合,包括:统计所述多个音频段中的每个音频段与所述多个音频段中的其他音频段之间的相似度总和;对每个所述音频片段的相似度总和进行平均化处理,得到每个所述音频段的平均相似度;对每个所述音频段的平均相似度进行检测,以确定出平均相似度为局部最大值的音频段;将确定出的音频段中每两个具有相邻关系且平均相似度大于预设相似度阈值的音频段进行合并得到重复音频段。5.如权利要求4所述的方法,其特征在于,所述根据所述重复音频段集合确定所述目标音频的副歌,包括:将所述重复音频段集合中的重复音频段进行合并,得到至少一个合并的音频段;对所述至少一个合并的音频段中的每个合并的音频段进行打分,得到每个合并的音频段的分值;将分值最高的合并的音频段作为所述目标音频的副歌。6.如权利要求5所述的方法,其特征在于,所述将所述重复音频段集合中的重复音频段进行合并,得到至少一个合并的音频段,包括:从所述重复音频段集合中获取具有相邻关系的多个目标重复音频段;计算所述多个目标重复音频段的特...

【专利技术属性】
技术研发人员:孔令城
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1