一种音频处理方法及装置制造方法及图纸

技术编号:10527861 阅读:88 留言:0更新日期:2014-10-09 12:43
本发明专利技术实施例提供了一种音频处理方法及装置,其中的方法可包括:从待处理的音频文件中选取区间音频数据;构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和Pitch序列;根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。本发明专利技术可以对音频文件进行副歌定位,提升音频处理的智能性。

【技术实现步骤摘要】
一种音频处理方法及装置
本专利技术涉及互联网
,具体涉及音频处理
,尤其涉及一种音频处理方法及装置。
技术介绍
副歌,通常指音频文件(如歌曲、音乐等等)的高潮部分。以歌曲为例,一首歌曲通常采用AA’BA’Form(音乐结构),A代表主歌,而B代表副歌;也即时说,通常一首歌曲由“前奏+两段主歌+一段副歌+过门音乐+一段副歌+一段主歌+结尾音乐”按顺序连接构成。副歌定位对音频文件的分析和处理起着重要作用,因此,如何在音频文件中进行副歌定位,成为音频处理领域的一个亟待解决的重要问题。
技术实现思路
本专利技术实施例提供一种音频处理方法及装置,可以对音频文件进行副歌定位,提升音频处理的智能性。本专利技术第一方面提供一种音频处理方法,可包括:从待处理的音频文件中选取区间音频数据;构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和Pitch(音高)序列;根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。本专利技术第二方面提供一种音频处理装置,可包括:选取模块,用于从待处理的音频文件中选取区间音频数据;构建模块,用于构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和Pitch序列;定位模块,用于根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。实施本专利技术实施例,具有如下有益效果:本专利技术实施例可从待处理的音频文件中选取区间音频数据,构建区间音频数据的特征参数序列,以实现音频文件的副歌定位,提升了音频处理的智能性;另外,由于仅需要从音频文件中选取区间音频数据进行音频处理,可有效提升音频处理的效率,进一步提升音频处理的智能性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种音频处理方法的流程图;图2为本专利技术实施例提供的图1所示的步骤S101的实施例的流程图;图3为本专利技术实施例提供的图1所示的步骤S102的实施例的部分流程图;图4为本专利技术实施例提供的图1所示的步骤S102的实施例的另一部分流程图;图5为本专利技术实施例提供的图1所示的步骤S103的实施例的流程图;图6为本专利技术实施例提供的一种音频处理装置的结构示意图;图7为本专利技术实施例提供的选取模块的实施例的结构示意图;图8为本专利技术实施例提供的构建模块的实施例的部分结构示意图;图9为本专利技术实施例提供的构建模块的实施例的另一部分结构示意图;图10为本专利技术实施例提供的预处理单元的实施例的结构示意图;图11为本专利技术实施例提供的定位模块的实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例中,音频文件可以包括但不限于:歌曲、歌曲片段、音乐、音乐片段、演奏乐、演奏乐片段、哼唱歌曲、哼唱歌曲片段等文件。本专利技术实施例的音频处理方案可以应用于互联网领域的多个场景中,例如:可以应用于对互联网音频库中的音频文件进行分析处理的场景,包括:可应用于主音查找的场景中进行副歌的快速定位和准确提取,也可应用于哼唱搜索的场景中进行副歌的快速定位和准确提取,还可应用于乐曲识别的场景中进行副歌的快速定位和准确提取等等;或者,可以应用于对互联网音频库中的音频文件进行试听的场景,包括:可提供副歌进行在线播放或音乐下载前的试听;或者,可以应用于彩铃下载或试听场景,包括:快速定位和准确提取副歌,将副歌作为彩铃提供给用户进行下载或试听,等等。下面将结合附图1-附图5,对本专利技术实施例提供的音频处理方法进行详细介绍。需要说明的是,附图1-附图5所示的音频处理方法可以由本专利技术实施例提供的音频处理装置所执行,该音频处理装置可运行于终端设备或服务器中,其中,终端设备可包括但不限于:PC(PersonalComputer,个人计算机)、PAD(平板电脑)、手机、智能手机、笔记本电脑等设备。请参见图1,为本专利技术实施例提供的一种音频处理方法的流程图;该方法可包括以下步骤S101-步骤S103。S101,从待处理的音频文件中选取区间音频数据。本专利技术实施例中,区间音频数据指从音频文件中所选取的、某个时长区间范围所确定的音频数据,例如:假设音频文件的时长为T,[T/5,3T/5]的时长区间范围可确定一个区间音频数据,[T/2,T]的时长区间范围又可确定另一个区间音频数据,等等。本步骤中,可根据实际情况从音频文件中选取合理的区间音频数据,例如:根据对大量音频文件的统计数据,从音频文件中选取区间音频数据;或者根据对音频文件进行分析处理获得的实验数据,从音频文件中选取区间音频数据。S102,构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和Pitch序列。Pitch指各种不同高低的声音,即音的高度,音的基本特征的一种。一个区间音频数据可以表示为多帧音频帧信号组成的一个帧序列,该区间音频数据的每帧音频帧信号均具备能量和Pitch值。本步骤中,可以对该区间音频数据的每一帧音频帧信号进行能量计算,获得该区间音频数据的每一帧音频帧信号的能量,从而构建该区间音频数据的能量序列;可以对该区间音频数据的每一帧音频帧信号进行Pitch检测,获得该区间音频数据的每一帧音频帧信号的Pitch值,从而构建该区间音频数据的Pitch序列。S103,根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。副歌,通常指音频文件的高潮部分。以歌曲为例,一首歌曲通常采用AA’BA’Form,A代表主歌,而B代表副歌;也即时说,通常一首歌曲由“前奏+两段主歌+一段副歌+过门音乐+一段副歌+一段主歌+结尾音乐”按顺序连接构成。本步骤可基于所选取的区间音频数据的特征参数序列,定位音频文件的副歌。下面将结合附图2-附图5,对图1所示的音频处理方法中的各步骤进行详细介绍。请参见图2,为本专利技术实施例提供的图1所示的步骤S101的实施例的流程图;该步骤S101可包括以下步骤s1101-步骤s1103。s1101,获取所述待处理的音频文件的时长。本实施例可假设音频文件的时长为T,即所述音频文件的时长区间为[0,T]。s1102,按照预设的时间比范围,计算所选取的时长区间。时间比范围可表示为[RL,RH],其中RL和RH分别代表时间占比,[RL,RH]的取值为[0,1],且RL<RH。时间比范围[RL,RH]可以根据实际情况进行设定,例如:时间比范围可根据对大量音频文件的统计数据进行设定;或者时间比范围可根据对音频文件进行分析处理获得的实验数据进行设定。假设预设的时间比范围为[1/5,3/5],即RL=1/5,RH=3/5,本步骤计算获得所选取的时长区间则为[T/5,3T/5]。s1103,根据所述时长区间,从所述音频文件中选取区间音频数据。参照步骤s1102所示例子,本步骤可从音频文件中选取[T/5,3T/5]这一时长区间所确定本文档来自技高网...
一种音频处理方法及装置

【技术保护点】
一种音频处理方法,其特征在于,包括:从待处理的音频文件中选取区间音频数据;构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和音高Pitch序列;根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:从待处理的音频文件中选取区间音频数据;构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和音高Pitch序列,其中,所述能量序列由所述区间音频数据的每一帧音频帧信号的能量排列而成,所述Pitch序列是由所述区间音频数据的每一帧音频帧信号的Pitch值排列而成;分别对所述区间音频数据的能量序列和Pitch序列进行归一化处理;根据所述归一化后的能量序列、所述归一化后的Pitch序列以及预设的副歌时长,计算副歌在所述区间音频数据中的位置;根据所述副歌在所述区间音频数据中的位置,在所述音频文件中定位所述副歌。2.如权利要求1所述的方法,其特征在于,所述从待处理的音频文件中选取区间音频数据,包括:获取所述待处理的音频文件的时长;按照预设的时间比范围,计算所选取的时长区间;根据所述时长区间,从所述音频文件中选取区间音频数据。3.如权利要求2所述的方法,其特征在于,所述构建所述区间音频数据的特征参数序列,包括:对所述区间音频数据进行分帧处理,获得至少一帧音频帧信号;计算所述至少一帧音频帧信号中的各帧音频帧信号的能量;按照所述至少一帧音频帧信号中的各帧音频帧信号的顺序,对所述各帧音频帧信号的能量进行排列,构建所述区间音频数据的能量序列。4.如权利要求3所述的方法,其特征在于,所述构建所述区间音频数据的特征参数序列,还包括:对所述至少一帧音频帧信号的各帧音频帧信号进行预处理;对所述预处理后的各帧音频帧信号进行自相关计算,获得所述各帧音频帧信号的自相关函数;根据所述各帧音频帧信号的自相关函数,计算所述各帧音频帧信号的Pitch值;按照所述至少一帧音频帧信号中的各帧音频帧信号的顺序,对所述各帧音频帧信号的Pitch值进行排列,构建所述区间音频数据的Pitch序列。5.如权利要求4所述的方法,其特征在于,所述对所述至少一帧音频帧信号的各帧音频帧信号进行预处理,包括:对所述各帧音频帧信号进行加窗处理;对所述加窗处理后的各帧音频帧信号进行带通滤波处理。6.一种音频处理装置,其特征在于,包括:选取模块,用于从待处理的音频文件中选取区间音频数据;构建模块,用于构建所述区间音频数据的特征参数序...

【专利技术属性】
技术研发人员:赵伟峰李深远
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1