一种立体声音频的带宽扩展方法与装置制造方法及图纸

技术编号:15846327 阅读:40 留言:0更新日期:2017-07-18 18:39
本发明专利技术公开了一种立体声音频的带宽扩展方法与装置。该方法包括:将立体声信号分解为直达声和扩散声;按照预设的频带扩展方法对扩散声进行带宽扩展;将直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;将带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声;根据带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。借助于本发明专利技术的技术方案,解决了现有技术中仅根据单个声道重建信号的主观质量实现对信号带宽的扩展,没有考虑到两个声道中信号能量和相位的相关性,其重建立体声信号严重影响了听者对声源位置和距离的判定的问题。

【技术实现步骤摘要】
一种立体声音频的带宽扩展方法与装置
本专利技术涉及网络技术应用领域,特别涉及一种立体声音频的带宽扩展方法与装置。
技术介绍
在数字音频信号处理技术中,通常将覆盖人耳可感知的20Hz~20KHz全部频率范围内的音频信号称作全带音频,这类信号主要应用于音乐信号的高保真重现。现阶段的音频即时通信系统无法提供足够的网络传输速率和终端处理能力,不可避免地会限制重建信号的有效带宽,优先量化编码音频信号的低频成分,进而提升音频通信系统的编码效率。传统电话语音通信系统通常传输的是窄带信号,其频率分布在300~3400Hz范围内,采样率为8kHz。相关主观听力测试结果表明,窄带语音中保留了91%的音节可懂度以及99%的语句可理解性。但是相比于真实语音,在实际通话中所传输窄带信号的自然度和主观质量均有明显下降。由于高频成分的缺失,窄带语音无法良好地区分部分的清音或爆破音,并削弱了其描述说话人特性的能力。为了有效地克服窄带音频的不足,宽带音频被广泛应用到了电话语音通信领域中,其有效带宽扩展到50Hz~7kHz,较好地覆盖了表征语音信号重要特性的大部分频谱,实现了接近调幅广播的音质水平。然而受到历史、经济、本文档来自技高网...
一种立体声音频的带宽扩展方法与装置

【技术保护点】
一种立体声音频的带宽扩展方法,其特征在于,包括:将立体声信号分解为直达声和扩散声;按照预设的频带扩展方法对所述扩散声进行带宽扩展;将所述直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;将所述带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声,根据所述带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。

【技术特征摘要】
1.一种立体声音频的带宽扩展方法,其特征在于,包括:将立体声信号分解为直达声和扩散声;按照预设的频带扩展方法对所述扩散声进行带宽扩展;将所述直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;将所述带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声,根据所述带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。2.如权利要求1所述的立体声音频的带宽扩展方法,其特征在于,所述将立体声信号分解为直达声和扩散声,包括:将所述立体声信号分解为左声道和右声道;分别将分帧处理后的左声道和右声道进行时频变换,得到立体声信号的左声道短时频谱成分和右声道短时频谱成分;分别根据所述左声道短时频谱成分和右声道短时频谱成分,得到左右声道信号能量谱之间的和Psum、左右声道信号能量谱之间的差Pdiff、左右声道信号能量谱之间的互相关Pcc;利用所述Psum、Pdiff及Pcc,通过最小二乘法得到直达声矩阵;利用所述直达声矩阵从所述立体声信号中分离出直达声;在所述立体声信号中剔除所述直达声,得到扩散声。3.如权利要求1所述的立体声音频的带宽扩展方法,其特征在于,所述将所述直达声分离成多个不同方位的点声源,包括:计算每一个时频点上直达声的方向信息,对全部时频点的方向信息进行聚类,得到方向信息的聚类中心,所述聚类中心分别对应各个点声源的方向信息;根据某一时频点上直达声的方向信息和所述方向信息的聚类中心,得到掩蔽矩阵;利用所述掩蔽矩阵对直达声进行分离,得到多个不同方位的点声源。4.如权利要求1所述的立体声音频的带宽扩展方法,其特征在于,所述对多个点声源分别进行带宽扩展,包括:将多个点声源分别输入到预设的状态空间模型中拟合窄带信号的短时频谱和宽带信号的短时频谱之间的映射关系,并根据预设的误差准则对宽带信号短时频谱高频成分的频谱包络进行估计,结合低频频谱包络和采用适当频谱修补方法扩展后的频谱细节,得到带宽扩展后的多个点声源。5.如权利要求4所述的立体声音频的带宽扩展方法,其特征在于,所述在所述状态空间模型中拟合窄带信号的短时频谱和宽带信号的短时频谱之间的映射关系,并根据预设的误差准则对高频成分的频谱包络进行估计,包括:利用前一时刻隐藏状态矢量和前一时刻窄带信号的短时频谱,得到所述预设状态空间模型中的隐藏状态矢量;利用所述预设状态空间模型中的隐藏状态矢量和当前时刻窄带信号的短时频谱,得到宽带信号的短时频谱...

【专利技术属性】
技术研发人员:高昕颜永红邹潇湘白海钏舒敏云晓春王锟张震计哲董琳金暐王中华李海灵李佳
申请(专利权)人:国家计算机网络与信息安全管理中心中国科学院声学研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1