一种立体声信号处理方法及装置制造方法及图纸

技术编号：24105745 阅读：47 留言：0更新日期：2020-05-09 16:57

一种立体声信号处理方法及装置，其中方法包括：对当前帧的立体声信号进行时延估计，确定所述当前帧的声道间时间差；所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差；若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同，则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理；所述第一声道信号为所述当前帧的目标声道信号，所述第二声道信号与所述前一帧的目标声道信号处于相同声道。

A stereo signal processing method and device

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】一种立体声信号处理方法及装置本申请要求在2017年5月16日提交国家专利局、申请号为201710344704.4、专利技术名称为“一种立体声信号处理方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。
本申请涉及信息
，尤其涉及一种立体声信号处理方法及装置。
技术介绍
随着生活质量的提高，人们对高质量音频的需求不断增大。相对于单声道音频，立体声音频具有各声源的方位感和分布感，能够提高信息的清晰度、可懂度及临场感，因而备受人们青睐。现有的时域立体声编码技术，通常是在时域将左声道信号和右声道信号下混为中央通道(Mid channel)信号以及边通道(Side channel)信号。下混后的中央通道信号可以表示为0.5×(L+R)，表征了左声道信号和右声道信号之间的相关信息；下混后的边通道信号可以表示为0.5×(L-R)，表征了左声道信号和右声道信号之间的差异信息，其中L表示左声道信号，R表示右声道信号。然后，再分别对中央通道信号及边通道信号采用单声道编码方法进行编码。对于中央通道信号，通常用较多的比特数进行编码；对于边通道信号，通常用较少的比特数进行编码。为了提高编码效率，需要使得中央通道信号更大，而边通道信号更小。目前在时域立体声编码中，在获得中央通道信号及边通道信号之前会使用匹配算法对左声道信号和右声道信号进行时延估计得到声道间时间差，并根据声道间时间差对左声道信号和右声道信号进行时延对齐处理，从而使得下混后获得的中央通道信号更大、而边通道信号更小。根据声道间时间差进行时延对齐的算法中...

【技术保护点】
一种立体声信号处理方法，其特征在于，所述方法包括：/n对当前帧的立体声信号进行时延估计，确定所述当前帧的声道间时间差；所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差；/n若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同，则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理；所述第一声道信号为所述当前帧的目标声道信号，所述第二声道信号与所述前一帧的目标声道信号处于相同声道。/n

【技术特征摘要】
【国外来华专利技术】20170516 CN 2017103447044一种立体声信号处理方法，其特征在于，所述方法包括：
对当前帧的立体声信号进行时延估计，确定所述当前帧的声道间时间差；所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差；
若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同，则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理；所述第一声道信号为所述当前帧的目标声道信号，所述第二声道信号与所述前一帧的目标声道信号处于相同声道。

根据权利要求1所述的方法，其特征在于，根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理，包括：
将所述当前帧的第一声道信号中第一处理长度的信号压缩为第一对齐处理长度的信号，以获得时延对齐处理后的所述当前帧的第一声道信号；
所述第一处理长度是根据所述当前帧的声道间时间差和所述第一对齐处理长度确定的，所述第一处理长度大于所述第一对齐处理长度。

根据权利要求2所述的方法，其特征在于，所述第一处理长度为所述当前帧的声道间时间差的绝对值与所述第一对齐处理长度之和。

根据权利要求3所述的方法，其特征在于，所述第一处理长度的信号的起始点位于所述第一对齐处理长度的信号的起始点之前、且所述第一处理长度的信号的起始点与第一对齐处理长度的信号的起始点之间的长度为当前帧的声道间时间差的绝对值。

根据权利要求3所述的方法，其特征在于，所述第一对齐处理长度的信号的起始点位于当前帧的第一声道信号的起始点或位于当前帧的第一声道信号的起始点之后，且所述第一对齐处理长度的信号的起始点与所述当前帧的第一声道信号结束点之间的长度大于或等于所述第一对齐处理长度。

根据权利要求3所述的方法，其特征在于，所述第一对齐处理长度的信号的起始点位于当前帧的第一声道信号的起始点之前，且与当前帧的第一声道信号的起始点之间的长度小于或等于过渡长度，且所述第一对齐处理长度的信号的起始点与所述当前帧的第一声道信号的结束点之间的长度大于或等于所述第一对齐处理长度与所述过渡长度之和，其中，所述过渡长度小于或等于当前帧的声道间时间差的绝对值的最大值。

根据权利要求1至6任一所述的方法，其特征在于，根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理，包括：
将所述当前帧的第二声道信号中第二处理长度的信号拉伸为第二对齐处理长度的信号，以获得时延对齐处理后的所述当前帧的第二声道信号；
所述第二处理长度是根据所述前一帧的声道间时间差和所述第二对齐处理长度确定的，所述第二处理长度小于所述第二对齐处理长度。

根据权利要求7所述的方法，其特征在于，所述第二处理长度为所述第二对齐处理长度与所述前一帧的声道间时间差的绝对值之差。

根据权利要求8所述的方法，其特征在于，所述第二处理长度的信号的起始点位

于所述第二对齐处理长度的信号的起始点之后、且所述第二处理长度的信号的起始点与第二对齐处理长度的信号的起始点之间的长度为前一帧的声道间时间差的绝对值。

根据权利要求8所述的方法，其特征在于，所述第二对齐处理长度的信号的起始点位于当前帧的第二声道信号的起始点或位于当前帧的第二声道信号的起始点之后，且所述第二对齐处理长度的信号的起始点与所述当前帧的第二声道信号的结束点之间的长度大于或等于所述第二对齐处理长度。

根据权利要求7至10任一所述的方法，其特征在于，所述第二对齐处理长度的信号的起始点与当前帧的第二声道信号的起始点之间的长度等于第二预设长度；所述第一对齐处理长度的信号的起始点与当前帧的第一声道信号的起始点之间的长度等于第二预设长度与第二对齐处理长度之和。

根据权利要求2至11任一所述的方法，其特征在于，所述第一对齐处理长度小于或等于所述当前帧的帧长，所述第一对齐处理长度为预先设定的长度，或者，所述第一对齐处理长度满足以下公式：

其中，L_next_target为所述第一对齐处理长度，cur_itd为所述当前帧的声道间时间差，prev_itd为所述前一帧的声道间时间差，L为时延对齐处理的处理长度。

根据权利要求7至12任一所述的方法，其特征在于，所述第二对齐处理长度小于或等于所述当前帧的帧长，所述第二对齐处理长度为预先设定的长度，或者，所述第二对齐处理长度满足以下公式：

其中，L_pre_target为所述第二对齐处理长度，cur_itd为所述当前帧的声道间时间差，prev_itd为所述前一帧的声道间时间差，L为时延对齐处理的处理长度。

根据权利要求12或13所述的方法，其特征在于，所述时延对齐处理的处理长度小于或等于所述当前帧的帧长，所述时延对齐处理的处理长度为预先设定的长度；或者，所述时延对齐处理的处理长度满足以下公式：

其中，L为时延对齐处理的处理长度，MAX_DELAY_CHANGE为相邻帧声道间时间差的最大差值，L_init为预设的时延对齐处理的处理长度。

一种立体声信号处理方法，其特征在于，所述方法包括：
根据接收到的码流确定当前帧的声道间时间差；所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差；
若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同，则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延恢复处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延恢复处理；所述第一声道信号为所述当前帧的目标声道信号，所述第二声道信号与所述前一帧的目标声

道信号处于相同声道。

根据权利要求15所述的方法，其特征在于，所述根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延恢复处理，包括：
将所述当前帧的第一声道信号中第三处理长度的信号拉伸为第三对齐处理长度的信号，以获得时延恢复处理后的所述当前帧的第一声道信号；
所述第三处理长度是根据所述当前帧的声道间时间差和所述第三对齐处理长度确定的，所述第三处理长度小于所述第三对齐处理长度。

根据权利要求16所述的方法，其特征在于，所述第三处理长度为所述第三对齐处理长度与所述当前帧的声道间时间差的绝对值之差。

根据权利要求17所述的方法，其特征在于，所述第三处理长度的信号的起始点位于所述第三对齐处理长度的信号的起始点之后、且所述第三处理长度的信号的起始点与第三对齐处理长度的信号的起始点之间的长度为当前帧的声道间时间差的绝对值。

根据权利要求18所述的方法，其特征在于，所述第三处理长度的信号的起始点位于所述当前帧的第一声道信号的起始点或位于当前帧的第一声道信号的起始点之后，且所述第三处理长度的信号的起始点与当前帧的第一声道信号的结束点之间的长度大于或等于所述第三对齐处理长度与当前帧的声道间时间差的绝对值之差。

根据权利要求15至16任一所述的方法，其特征在于，所述根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延恢复处理，包括：
将所述当前帧的第二声道信号中第四处理长度的信号压缩为第...

【专利技术属性】
技术研发人员：艾雅·苏谟特，李海婷，苗磊，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人