一种基于方差和时域峰值的多级音频暂稳态判决方法技术

技术编号：16039821 阅读：57 留言：0更新日期：2017-08-19 21:50

一种基于方差和时域峰值的多级音频暂稳态判决方法，包括：对原始音频信号以1024个采样点为单位进行分帧；对每帧信号分别计算均值和方差，并与已设定的方差阈值进行比较，方差小于等于所述方差阈值的信号帧，则设定所述信号帧的判决标志为1，输出稳态帧标志；对方差大于所述方差阈值的信号帧，采用峰值检测算法进行判定；对峰值检测算法的判定结果进行判决，如果判决标志为1，则输出稳态帧标志，如果判决标志为0，则输出暂态帧标志。本发明专利技术利用信号的方差和时域峰值来对音频的暂稳态进行判决，得到的暂稳态信号用于进行自适应窗切换，对暂稳态的判决复杂度低且准确率高。在时间复杂度上更简单，并且可以避免检测能量较低的信号，提高了检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于方差和时域峰值的多级音频暂稳态判决方法
本专利技术涉及一种音频暂稳态判决方法。特别是涉及一种基于方差和时域峰值的多级音频暂稳态判决方法。
技术介绍
现有的大部分音频编码标准都是基于心理声学模型，利用人耳的掩蔽效应，对原始音频信号进行压缩编码，即所谓的音频感知编码。如世界范围内广泛使用的AC-3、AAC、MPEG-2以及拥有我国自主知识产权的AVS和DRA。在目前主流的音频编码标准中，一般采用窗函数的方法对信号进行处理，通过窗函数将信号分成一个一个的数据块，然后对每个数据块单独进行处理，通过量化、熵编码，形成最终的输出比特流。在基于分块的音频编码技术中，预回声一直是很难解决的问题。预回声产生的根本原因在于音频信号中存在的暂态信息，当它从时域变换到频域后，会存在大量的高频分量，在输出码率一定的情况下，必然会产生量化噪声，量化噪声经反变换到时域后会扩散，由于声音的前向掩蔽的作用时间非常短，将有部分噪声不能被掩蔽掉，往往造成在低能量采样段出现人耳能明显感知的噪声，从而严重影响信号的音质。随着生活水平逐渐提高，人们对于数字音视频的要求也在不断的提高，而在预回声的产生在解码时表现为在人耳可识别的嚓嚓声，严重影响整个信号的音质，这与人们对声音质量不断提高的需求是完全相反的，因而难以被接受。另一方面，新的音频标准对于音频信号细节的描述也更加明显，这就要求更加精确的算法来区分信号的暂稳态。研究能够准确区分暂态、稳态信号，并且能够准确确定暂态位置与强度的算法，对于整个音频信号的编码过程具有十分重要的意义。解决预回声的方法之一就是自适应窗切换技术，也就是在编码前对音频信...
一种基于方差和时域峰值的多级音频暂稳态判决方法

【技术保护点】
一种基于方差和时域峰值的多级音频暂稳态判决方法，其特征在于，包括如下步骤：1)对原始音频信号以1024个采样点为单位进行分帧；2)对每帧信号分别计算均值和方差，并与已设定的方差阈值进行比较，方差小于等于所述方差阈值的信号帧，则设定所述信号帧的判决标志为1，则输出稳态帧标志，否则进入下一步骤；3)对方差大于所述方差阈值的信号帧，采用峰值检测算法进行判定；4)对峰值检测算法的判定结果进行判决，如果判决标志为1，则输出稳态帧标志，如果判决标志为0，则输出暂态帧标志。

【技术特征摘要】
1.一种基于方差和时域峰值的多级音频暂稳态判决方法，其特征在于，包括如下步骤：1)对原始音频信号以1024个采样点为单位进行分帧；2)对每帧信号分别计算均值和方差，并与已设定的方差阈值进行比较，方差小于等于所述方差阈值的信号帧，则设定所述信号帧的判决标志为1，则输出稳态帧标志，否则进入下一步骤；3)对方差大于所述方差阈值的信号帧，采用峰值检测算法进行判定；4)对峰值检测算法的判定结果进行判决，如果判决标志为1，则输出稳态帧标志，如果判决标志为0，则输出暂态帧标志。2.根据权利要求1所述的一种基于方差和时域峰值的多级音频暂稳态判决方法，其特征在于，步骤3)包括：(1)对每一帧信号的1024个采样点，按照长度为256个采样点进行第一级块分割，得到4个数据块；(2)分别计算每个数据块的最大峰值，并与已设定的安静阈值进行比较，如果所...

【专利技术属性】
技术研发人员：张涛，唐伟，丁碧云，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人