音频处理的方法和装置制造方法及图纸

技术编号：11437518 阅读：48 留言：0更新日期：2015-05-08 15:38

本发明专利技术公开了一种音频处理的方法和装置，涉及计算机领域，能够自动地截取音频的高潮部分。所述方法包括：根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点；输出所述起点和所述终点之间的音频。本发明专利技术用于制作音频。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理的方法和装置
本专利技术涉及计算机领域，特别涉及一种音频处理的方法和装置。
技术介绍
随着互联网的普及和不断发展，人们已经越来越多地通过互联网来下载自己喜欢的铃声。当前互联网上的铃声主要是依赖人工通过手动截取音频的高潮部分的方式而制作的。但是，这种制作铃声的方式并不能准确地截取音频的高潮部分，且需要花费大量的人工成本。
技术实现思路
本专利技术实施例提供一种音频处理的方法和装置，能够自动地截取音频的高潮部分，节省人工成本。第一方面，提供一种音频处理的方法，所述方法包括：根据音频文件的波形图，自动确定所述音频文件的高潮部分的起点和终点；输出所述起点和所述终点之间的音频。其中，可选地，所述根据音频文件的波形图，自动确定所述音频文件的高潮部分的起点和终点可包括：根据音频文件的波形图，确定所述波形图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点；确定每簇数据点在所述波形图上对应的面积，并选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点。可选地，在本专利技术的一个实施例中，所述方法还包括：预先设置所述音频文件的高潮部分的最小时长；所述选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点包括：确定面积最大的一簇数据点的两端数据点对应的时间之差；若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。在本专利技术的另一个实施例中，进一步地，所述波形图是利用波形压缩比进行平滑处理后得到的波形图，其中，所述波形压缩比是指，在对所述音频文件...
音频处理的方法和装置

【技术保护点】
一种音频处理的方法，其特征在于，所述方法包括：根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点；输出所述起点和所述终点之间的音频。

【技术特征摘要】
1.一种音频处理的方法，其特征在于，所述方法包括：根据音频文件的波形图，自动确定所述音频文件的高潮部分的起点和终点；输出所述起点和所述终点之间的音频；所述根据音频文件的波形图，自动确定所述音频文件的高潮部分的起点和终点包括：根据音频文件的波形图，确定所述波形图上振幅值大于振幅阈值的数据点，其中，所述波形图上连续的所述数据点形成一簇数据点；确定每簇数据点在所述波形图上对应的面积，并选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点。2.如权利要求1所述的方法，其特征在于，所述方法还包括：预先设置所述音频文件的高潮部分的最小时长；所述选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点包括：确定面积最大的一簇数据点的两端数据点对应的时间之差；若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。3.如权利要求2所述的方法，其特征在于，所述波形图是利用波形压缩比进行平滑处理后得到的波形图，其中，所述波形压缩比是指，在对所述音频文件的波形进行平滑处理的过程中，在每个数据点的邻域内所选取的数据点数目；所述方法还包括：若所述差值小于所述最小时长，则调高波形压缩比，并执行以下步骤：a、重新根据所述音频文件的波形图，确定所述波形图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点；b、确定每簇数据点在所述波形图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差；c、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点；d、若差值仍小于所述最小时长，则继续调高波形压缩比，重复执行步骤a-c直至差值大于或等于所述最小时长。4.如权利要求3所述的方法，其特征在于，所述方法还包括：预先设置最大波形压缩比；若使用的波形压缩比大于所述最大波形压缩比，则调低所述振幅阈值，并执行以下步骤；e、根据音频文件的波形图，确定所述波形图上大于调整后的振幅阈值的振幅值，其中，连续的数据点形成一簇数据点；f、确定每簇数据点在所述波形图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差；g、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点；h、若差值小于所述最小时长，则继续调低所述振幅阈值，并执行步骤e-g直至差值大于或等于所述最小时长。5.如权利要求1-4任一所述的方法，其特征在于，在所述根据音频文件的波形图，自动确定所述音频文件的高潮部分的起点和终点之前，所述方法还包括：确定整个波形图中的振幅平均值；根据所述振幅平均值，确定振幅阈...

【专利技术属性】
技术研发人员：夏伟涛，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人