一种音频信号的高频扩展方法和音频播放器技术

技术编号：13917402 阅读：55 留言：0更新日期：2016-10-27 15:38

本发明专利技术公开了一种音频信号的高频扩展方法和音频播放器，用于实现对缺失高频部分的音频信号进行高频扩展，满足用户对高品质音频的要求。本发明专利技术实施例提供一种音频信号的高频扩展方法，包括：对原始的第一音频信号进行上采样，得到第二音频信号；获取所述第二音频信号的低频段频谱，并根据所述低频段频谱对所述第二音频信号进行高频段频谱的估计，得到高频段频谱包络线；按照所述高频段频谱包络线将所述低频段频谱拷贝到所述第二音频信号的高频段，得到第三音频信号；对所述第三音频信号进行能量调整，得到第四音频信号。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频处理
，尤其涉及一种音频信号的高频扩展方法和音频播放器。
技术介绍
人耳能听到的声音的频率范围大约为2-20千赫兹(Kilo Hertz，KHz)，普通人对音频信号的高频部分不太敏感，人耳虽然听不到频率超过20KHz的声音，但有些人能感觉到。在存储和传输音频文件时，为了节约空间和提高传输效率，往往要去掉人耳不太敏感的高频成分，这虽然损失了一定的音质，但是可以大大提高音频文件的压缩率，这种权衡迎合了市场的需求，例如大部分风靡一时的MP3音频文件就将高于16KHz的高频部分去掉，音质虽然下降了一些，但并不影响普通人欣赏音频文件，而且音频文件占用较小的存储空间，MP3也趁着互联网的东风流行起来，大大满足了普通人对音乐欣赏的需求。随着人们消费水平的提高，人们对音频文件的品质要求也日益提高，人们越来越喜欢高分辨率、频域成分完整的、高保真的高品质音乐。但是这种高品质的音频文件往往收费昂贵，因此对大部分免费的但缺失了高频成分的音频文件进行合理扩展以提高音频的播放效果就成了普通用户的极大需求，而现有技术中的音频播放器只能播放缺失高频成分的音频文件，而无法对这些音频文件进行高频扩展。
技术实现思路
本专利技术实施例提供了一种音频信号的高频扩展方法和音频播放器，用于实现对缺失高频部分的音频信号进行高频扩展，满足用户对高品质音频的要求。为解决上述技术问题，本专利技术实施例提供以下技术方案：第一方面，本专利技术实施例提供一种音频信号的高频扩展方法，包括：对原始的第一音频信号进行上采样，得到第二音频信号；获取所述第二音频信号的低频段频谱，并根据所述低频段频谱对...

【技术保护点】
一种音频信号的高频扩展方法，其特征在于，包括：对原始的第一音频信号进行上采样，得到第二音频信号；获取所述第二音频信号的低频段频谱，并根据所述低频段频谱对所述第二音频信号进行高频段频谱的估计，得到高频段频谱包络线；按照所述高频段频谱包络线将所述低频段频谱拷贝到所述第二音频信号的高频段，得到第三音频信号；对所述第三音频信号进行能量调整，得到第四音频信号。

【技术特征摘要】
1.一种音频信号的高频扩展方法，其特征在于，包括：对原始的第一音频信号进行上采样，得到第二音频信号；获取所述第二音频信号的低频段频谱，并根据所述低频段频谱对所述第二音频信号进行高频段频谱的估计，得到高频段频谱包络线；按照所述高频段频谱包络线将所述低频段频谱拷贝到所述第二音频信号的高频段，得到第三音频信号；对所述第三音频信号进行能量调整，得到第四音频信号。2.根据权利要求1所述的方法，其特征在于，所述对原始的第一音频信号进行上采样，得到第二音频信号，包括：对所述第一音频信号进行分帧，得到多个帧的第一音频信号，所述多个帧的第一音频信号中相邻两帧的第一音频信号之间有重叠；对每一帧的第一音频信号分别进行离散余弦变换DCT处理，得到DCT处理后的第一音频信号；根据采样率转换比在所述DCT处理后的每帧第一音频信号的尾端添加0，得到补0后的第一音频信号，所述采样率转换比为目标采样率和原采样率的比值；对所述补0后的第一音频信号进行逆离散余弦转换IDCT处理，得到IDCT处理后的第一音频信号；将所有帧的所述IDCT处理后的第一音频信号按照首尾拼接的方式连接起来，得到所述第二音频信号。3.根据权利要求2所述的方法，其特征在于，所述对所述补0后的第一音频信号进行逆离散余弦转换IDCT处理，得到IDCT处理后的第一音频信号之后，所述方法还包括：将所述IDCT处理后的第一音频信号的首端和尾端剪切掉，得到剪切掉首尾端的第一音频信号；所述将所有帧的所述IDCT处理后的第一音频信号按照首尾拼接的方式连接起来，得到所述第二音频信号，具体为：将所有帧的所述剪切掉首尾端的第一音频信号按照首尾拼接的方式连接起来，得到所述第二音频信号。4.根据权利要求3所述的方法，其特征在于，所述IDCT处理后的第一音频信号中剪切掉的首端和尾端的长度均为L1，所述L1的取值通过如下公式计算得到： L 1 = I D × L , ]]>其中，所述L1的取值为正整数，所述多个帧的第一音频信号中相邻两帧的第一音频信号之间的重叠区域的长度为2L，所述I表示目标采样率，所述D表示原采样率。5.根据权利要求1所述的方法，其特征在于，所述获取所述第二音频信号的低频段频谱，并根据所述低频段频谱对所述第二音频信号进行高频段频谱的估计，得到高频段频谱包络线，包括：对所述第二音频信号进行分帧，得到多个帧的第二音频信号；对每一帧的第二音频信号进行修正离散余弦变换MDCT处理，得到MDCT处理后的第二音频信号；采用随机采样检验算法对所述MDCT处理后的第二音频信号的低频段频谱的振幅绝对值的自然对数值进行直线拟合，得到低频段频谱包络线，所述低频段频谱包括：处于所述MDCT处理后的第二音频信号的有效截止频率之前的频谱段；按照所述低频段频谱包络线对应的直线方程估计所述MDCT处理后的第二音频信号的高频段频谱，得到所述高频段频谱包络线。6.根据权利要求5所述的方法，其特征在于，所述MDCT处理后的第二音频信号的有效截止频率通过如下方式获取：读取预先缓冲的T个帧的第二音频信号，并获取所述T个帧中每一个帧的第二音频信号的对应于多个频率点的频谱线，所述T的取值为自然数；对于所述T个帧中的每一个帧都按照如下对第一帧的处理方式确定出每一个帧的有效截止频率：从所述第一帧的最后一条频谱线往前开始搜索，找到第一频谱线对应的频率作为所述第一帧的有效截止频率，所述第一频谱线为所述第一帧的第二音频信号的对应于多个频率点的频谱线中第一条其振幅绝对值的自然对数值大于一预置门限的频谱线，所述第一帧为所述T个帧中的任意一个帧；获取到所述T个帧中每一个帧的有效截止频率之后，确定所述T个帧的T个有效截止频率中的最大值作为全局截止频率；从所述全局截止频率开始往前搜索所述MDCT处理后的第二音频信号的频谱线，找到第一条其振幅绝对值的自然对数值大于另一预置门限的频谱线对应的频率点作为所述MDCT处理后的第二音频信号的有效截止频率。7.根据权利要求5所述的方法，其特征在于，所述采用随机采样检验RANSAC算法对所述MDCT处理后的第二音频信号的低频段频谱进行直线拟合，得到低频段频谱包络线之后，所述方法还包括：根据预置的频谱坐标系中的最小值点、所述有效截止频率在所述频谱坐标系中的有效值点确定直线方程的校正参数；根据所述校正参数对所述低频段频谱包络线对应的直线方程进行参数调整。8.根据权利要求1至7中任意一项所述的方法，其特征在于，所述按照所述高频段频谱包络线将所述低频段频谱拷贝到所述第二音频信号的高频段，得到第三音频信号，包括：根据所述第二音频信号的有效截止频率将所述低频段频谱分为多个谱线段；将所述多个谱线段依次拷贝到所述第二音频信号的高频段，得到所述第三音频信号。9.根据权利要求1至7中任意一项所述的方法，其特征在于，所述对所述第三音频信号进行能量调整，得到第四音频信号，包括：根据所述第三音频信号的有效截止频率和信号终止频率将所述第三音频信号分为S个谱线段，其中，每一个谱线段包括w条谱线，所述S和w为自然数；所述S个谱线段中的每一条谱线通过如下方式进行能量调整：X′[n]＝X[n]×αi，n＝kc+i×w～kc+(i+1)×w-1，i＝0～S-1， α i = P i E i , ...

【专利技术属性】
技术研发人员：刘智成，胡以璇，
申请(专利权)人：TCL集团股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人