音频处理的方法和装置制造方法及图纸

技术编号:11437518 阅读:48 留言:0更新日期:2015-05-08 15:38
本发明专利技术公开了一种音频处理的方法和装置,涉及计算机领域,能够自动地截取音频的高潮部分。所述方法包括:根据音频文件的频谱图,自动确定所述音频文件的高潮部分的起点和终点;输出所述起点和所述终点之间的音频。本发明专利技术用于制作音频。

【技术实现步骤摘要】
音频处理的方法和装置
本专利技术涉及计算机领域,特别涉及一种音频处理的方法和装置。
技术介绍
随着互联网的普及和不断发展,人们已经越来越多地通过互联网来下载自己喜欢的铃声。当前互联网上的铃声主要是依赖人工通过手动截取音频的高潮部分的方式而制作的。但是,这种制作铃声的方式并不能准确地截取音频的高潮部分,且需要花费大量的人工成本。
技术实现思路
本专利技术实施例提供一种音频处理的方法和装置,能够自动地截取音频的高潮部分,节省人工成本。第一方面,提供一种音频处理的方法,所述方法包括:根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点;输出所述起点和所述终点之间的音频。其中,可选地,所述根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点可包括:根据音频文件的波形图,确定所述波形图上振幅值大于振幅阈值的数据点,其中,连续的数据点形成一簇数据点;确定每簇数据点在所述波形图上对应的面积,并选取面积最大的一簇数据点的两端数据点对应的时间,作为所述音频文件的高潮部分的起点和终点。可选地,在本专利技术的一个实施例中,所述方法还包括:预先设置所述音频文件的高潮部分的最小时长;所述选取面积最大的一簇数据点的两端数据点对应的时间,作为所述音频文件的高潮部分的起点和终点包括:确定面积最大的一簇数据点的两端数据点对应的时间之差;若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。在本专利技术的另一个实施例中,进一步地,所述波形图是利用波形压缩比进行平滑处理后得到的波形图,其中,所述波形压缩比是指,在对所述音频文件的波形进行平滑处理的过程中,在每个数据点的邻域内所选取的数据点数目;所述方法还可包括:若所述差值小于所述最小时长,则调高波形压缩比,并执行以下步骤:a、重新根据所述音频文件的波形图,确定所述波形图上振幅值大于振幅阈值的数据点,其中,连续的数据点形成一簇数据点;b、确定每簇数据点在所述波形图上对应的面积,确定面积最大的一簇数据点的两端数据点对应的时间之差;c、若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点;d、若差值仍小于所述最小时长,则继续调高波形压缩比,重复执行步骤a-c直至差值大于或等于所述最小时长。在本专利技术的另一个实施例中,进一步地,所述方法还可包括:预先设置最大波形压缩比;若使用的波形压缩比大于所述最大波形压缩比,则调低所述振幅阈值,并执行以下步骤;e、根据音频文件的波形图,确定所述波形图上大于调整后的振幅阈值的振幅值,其中,连续的数据点形成一簇数据点;f、确定每簇数据点在所述波形图上对应的面积,确定面积最大的一簇数据点的两端数据点对应的时间之差;g、若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点;h、若差值小于所述最小时长,则继续调低所述振幅阈值,并执行步骤e-g直至差值大于或等于所述最小时长。其中,在本专利技术的一个实施例中,在所述根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点之前,所述方法还可包括:确定整个波形图中的振幅平均值;根据所述振幅平均值,确定振幅阈值。第二方面,提供一种音频处理的装置,所述装置包括:处理模块,用于根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点;输出模块,用于输出所述起点和所述终点之间的音频。其中,可选地,所述处理模块具体用于:根据音频文件的波形图,确定所述波形图上振幅值大于振幅阈值的数据点,其中,连续的数据点形成一簇数据点;确定每簇数据点在所述波形图上对应的面积,并选取面积最大的一簇数据点的两端数据点对应的时间,作为所述音频文件的高潮部分的起点和终点。可选地,在本专利技术的一个实施例中,所述装置还包括:设置模块,用于预先设置所述音频文件的高潮部分的最小时长;当选取面积最大的一簇数据点的两端数据点对应的时间,作为所述音频文件的高潮部分的起点和终点时,所述处理模块具体用于:确定面积最大的一簇数据点的两端数据点对应的时间之差;若差值大于或等于所述设置模块设置的最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。在本专利技术的另一个实施例中,进一步地,所述波形图是利用波形压缩比进行平滑处理后得到的波形图,其中,所述波形压缩比是指,在对所述音频文件的波形进行平滑处理的过程中,在每个数据点的领域内所选取的数据点数目;所述处理模块,还用于若所述差值小于所述最小时长,则调高波形压缩比,并执行以下步骤:a、重新根据所述音频文件的波形图,确定所述波形图上振幅值大于振幅阈值的数据点,其中,连续的数据点形成一簇数据点;b、确定每簇数据点在所述波形图上对应的面积,确定面积最大的一簇数据点的两端数据点对应的时间之差;c、若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点;d、若差值仍小于所述最小时长,则继续调高波形压缩比,重复执行步骤a-c直至差值大于或等于所述最小时长。在本专利技术的另一个实施例中,进一步地,所述设置模块,还用于预先设置最大波形压缩比;所述处理模块,还用于若使用的波形压缩比大于所述设置模块设置的最大波形压缩比,则调低所述振幅阈值,并执行以下步骤:e、根据音频文件的波形图,确定所述波形图上大于调整后的振幅阈值的振幅值,其中,连续的数据点形成一簇数据点;f、确定每簇数据点在所述波形图上对应的面积,确定面积最大的一簇数据点的两端数据点对应的时间之差;g、若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点;h、若差值小于所述最小时长,则继续调低所述振幅阈值,并执行步骤e-g直至差值大于或等于所述最小时长。其中,可选地在本专利技术的一个实施例中,所述处理模块还用于:确定整个波形图中的振幅平均值;根据所述振幅平均值,确定振幅阈值。本专利技术实施例提供的音频处理的方法和装置,根据音频文件的波形图来确定所述音频文件的高潮部分的起点和终点,相比于相关技术手动确定高潮部分起点和终点的方式,提高了精确度,且能够自动地截取音频的高潮部分,节省人工成本。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种音频处理的方法的流程图;图2A是本专利技术实施例提供的另一种音频处理的方法的流程图;图2B是本专利技术实施例提供的一种示意波形图;图3是本专利技术实施例提供的另一种音频处理的方法的流程图;图4A是本专利技术实施例提供的音频处理的装置的结构示意图;图4B是本专利技术实施例提供的音频处理的装置的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。图1是本专利技术实施例提供的一种音频处理的方法的流程图。参照图1,本专利技术实施例提供的音频处理的方法可包括:11、根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点;12、输出所述起点和所述终点之间本文档来自技高网...
音频处理的方法和装置

【技术保护点】
一种音频处理的方法,其特征在于,所述方法包括:根据音频文件的频谱图,自动确定所述音频文件的高潮部分的起点和终点;输出所述起点和所述终点之间的音频。

【技术特征摘要】
1.一种音频处理的方法,其特征在于,所述方法包括:根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点;输出所述起点和所述终点之间的音频;所述根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点包括:根据音频文件的波形图,确定所述波形图上振幅值大于振幅阈值的数据点,其中,所述波形图上连续的所述数据点形成一簇数据点;确定每簇数据点在所述波形图上对应的面积,并选取面积最大的一簇数据点的两端数据点对应的时间,作为所述音频文件的高潮部分的起点和终点。2.如权利要求1所述的方法,其特征在于,所述方法还包括:预先设置所述音频文件的高潮部分的最小时长;所述选取面积最大的一簇数据点的两端数据点对应的时间,作为所述音频文件的高潮部分的起点和终点包括:确定面积最大的一簇数据点的两端数据点对应的时间之差;若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。3.如权利要求2所述的方法,其特征在于,所述波形图是利用波形压缩比进行平滑处理后得到的波形图,其中,所述波形压缩比是指,在对所述音频文件的波形进行平滑处理的过程中,在每个数据点的邻域内所选取的数据点数目;所述方法还包括:若所述差值小于所述最小时长,则调高波形压缩比,并执行以下步骤:a、重新根据所述音频文件的波形图,确定所述波形图上振幅值大于振幅阈值的数据点,其中,连续的数据点形成一簇数据点;b、确定每簇数据点在所述波形图上对应的面积,确定面积最大的一簇数据点的两端数据点对应的时间之差;c、若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点;d、若差值仍小于所述最小时长,则继续调高波形压缩比,重复执行步骤a-c直至差值大于或等于所述最小时长。4.如权利要求3所述的方法,其特征在于,所述方法还包括:预先设置最大波形压缩比;若使用的波形压缩比大于所述最大波形压缩比,则调低所述振幅阈值,并执行以下步骤;e、根据音频文件的波形图,确定所述波形图上大于调整后的振幅阈值的振幅值,其中,连续的数据点形成一簇数据点;f、确定每簇数据点在所述波形图上对应的面积,确定面积最大的一簇数据点的两端数据点对应的时间之差;g、若差值大于或等于所述最小时长,则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点;h、若差值小于所述最小时长,则继续调低所述振幅阈值,并执行步骤e-g直至差值大于或等于所述最小时长。5.如权利要求1-4任一所述的方法,其特征在于,在所述根据音频文件的波形图,自动确定所述音频文件的高潮部分的起点和终点之前,所述方法还包括:确定整个波形图中的振幅平均值;根据所述振幅平均值,确定振幅阈...

【专利技术属性】
技术研发人员:夏伟涛
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1