The invention relates to an audio signal processing device and method, such as audio signal mixing device (105), for the use of mixed matrix D will include a plurality of input channels (113) of the input audio signal processing includes a plurality of main output channels (123) and at least one auxiliary output channel (125) of the output audio signal, wherein the mixed matrix D for providing the primary output channels (123) mixed matrix DU and for providing the at least one auxiliary output channel main (125) under the assistance of mixed matrix DW. The audio signal lower mixing device (105) includes an auxiliary mixed matrix determiner (107) and a processor (109). The mixed matrix assisted determiner (107) used by the operation determines the mixing matrix assisted DW: calculated by the input audio signal of the plurality of input channels (113) multiple feature vector covariance matrix defined by COV; at least one eigenvector of the covariance matrix of COV the plurality of feature vectors in the vector is determined between the at least one feature vector and the main mixed matrix DU column defined subspace angle; the subspace angle and the threshold angle MIN from the plurality of feature vector select at least one feature vector based on; and through the at least one of the selected feature vector to define the auxiliary mixed matrix DW with at least one column. The processor (109) is used to process the input audio signal into the output audio signal using the mixed matrix D.
【技术实现步骤摘要】
【国外来华专利技术】音频信号处理装置和方法
本专利技术涉及音频信号处理装置和方法。具体地,本专利技术涉及用于对音频信号进行下混和上混的音频信号处理装置和方法。
技术介绍
声音编码、传输、记录、混合和再现的技术一直是数十年来的研发主题。从单声道技术开始,多声道音频技术已逐渐发展到立体声、四声道、5.1声道等。与传统的单声道或立体声音频相比,多声道音频给终端用户带来了全新的的聆听体验,因此越来越吸引音频制作者。为了成功实现多声道音频,可以在支持包括任意数量的记录声道Q的子集M的传统播放设备的基础上,再现多声道音频。播放设备中M个再现声道,如扬声器或耳机,的子集可以根据用户需求而变化。当用户切换其设备,例如从立体声切换到5.1声道或从立体声切换到任何3个扬声器设备时,可能发生这种情况。在传统播放设备上再现多声道音频的传统方式是通过使用固定的下混矩阵来将Q声道音频输入信号下混到仅具有M个声道的音频输出信号中。可以在发送器或接收器侧进行,这受到立体声、5.1声道和7.1声道等普遍可用内容格式的约束。到目前为止,如果没有事先的再现布局信息,任何播放设备都不可能以最佳和灵活的方式支持任意数量的输出 ...
【技术保护点】
一种音频信号下混装置(105),所述音频信号下混装置(105)用于使用下混矩阵(D)将包括多个输入声道(113)的输入音频信号处理成包括多个主输出声道(123)和至少一个辅助输出声道(125)的输出音频信号,其特征在于,所述下混矩阵(D)包括用于提供所述多个主输出声道(123)的主下混矩阵(DU)和用于提供所述至少一个辅助输出声道(125)的辅助下混矩阵(DW),所述音频信号下混装置(105)包括:辅助下混矩阵确定器(107),用于通过以下操作确定所述辅助下混矩阵(DW):计算由所述输入音频信号的所述多个输入声道(113)定义的协方差矩阵(COV)的多个特征向量;为所述协方 ...
【技术特征摘要】
【国外来华专利技术】1.一种音频信号下混装置(105),所述音频信号下混装置(105)用于使用下混矩阵(D)将包括多个输入声道(113)的输入音频信号处理成包括多个主输出声道(123)和至少一个辅助输出声道(125)的输出音频信号,其特征在于,所述下混矩阵(D)包括用于提供所述多个主输出声道(123)的主下混矩阵(DU)和用于提供所述至少一个辅助输出声道(125)的辅助下混矩阵(DW),所述音频信号下混装置(105)包括:辅助下混矩阵确定器(107),用于通过以下操作确定所述辅助下混矩阵(DW):计算由所述输入音频信号的所述多个输入声道(113)定义的协方差矩阵(COV)的多个特征向量;为所述协方差矩阵(COV)的所述多个特征向量中的至少一个特征向量确定所述至少一个特征向量与由所述主下混矩阵(DU)的列定义的向量之间的子空间角;基于所述子空间角和预设阈值角θMIN从所述多个特征向量中选择至少一个特征向量;及通过所述至少一个选定的特征向量来定义所述辅助下混矩阵(DW)的至少一列;以及处理器(109),用于使用所述下混矩阵(D)将所述输入音频信号处理成所述输出音频信号。2.根据权利要求1所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵确定器(107)用于通过确定所述协方差矩阵(COV)的所述多个特征向量中的每个特征向量与由所述主下混矩阵(DU)的所述列定义的多个向量之间的多个角中的最小角来确定所述子空间角。3.根据权利要求2所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵确定器(107)用于通过选择所述子空间角大于所述预设阈值角θMIN的特征向量,来基于所述子空间角和所述预设阈值角θMIN从所述多个特征向量中选择特征向量。4.根据任一项前述权利要求所述的音频信号下混装置(105),其特征在于,所述主下混矩阵(DU)的大小由所述输入音频信号的输入声道(113)的数量和所述输出音频信号的主输出声道(123)的数量确定。5.根据任一项前述权利要求所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵(DW)的大小由所述输出音频信号的辅助输出声道(125)的数量确定。6.根据任一项前述权利要求所述的音频信号下混装置(105),其特征在于,所述音频信号下混装置(105)还包括:主下混矩阵确定器(111),用于基于固定波束成形器方法或自适应波束成形器方法确定所述主下混矩阵(DU)。7.根据任一项前述权利要求所述的音频信号下混装置(105),其特征在于,所述处理器(109)用于以多个输入音频时间帧的形式处理所述多个输入声道(113)中的每一个的所述输入音频信号,并且所述处理器(109)还用于通过以下操作处理所述输入音频信号:为所述多个输入声道(113)中的每一个确定所述多个输入音频信号时间帧的离散傅立叶变换,得到所述多个输入音频信号时间帧及所述输入音频信号的所述多个输入声道(113)在多个频率点处的多个傅立叶系数。8.根据权利要求7所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵确定器(107)用于通过以下操作确定所述辅助下混矩阵(DW):使用以下等式为所述多个输入音频信号时间帧的给定输入音频信号时间帧n以及为所述多个频率点的给定频率点j确定所述协方差矩阵(COV)的系数cxy:其中E{}表示期望算子,jx表示所述输入音频信号的输入声道x在频率点j处的傅立叶系数,*表示复共轭,x和y的范围是从1到输入声道(113)的数量。9.根据权利要求7所述的音频信号下混装置(105),其特征在于,所述辅助下混矩阵确定器(107)用于通过以下操作确定所述辅助下混矩阵(DW):使用以下等式为所述多个输入音频信号时间帧的给定输入音频信号时间帧n以及为所述多个频率点的给定频率点j确定所述协方差矩阵(COV)的系数cxy:
【专利技术属性】
技术研发人员:潘吉·赛提亚万,卡里姆·赫尔旺尼,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。