一种将两个声道声音信号转换成三个声道信号的方法技术

技术编号：13457535 阅读：116 留言：0更新日期：2016-08-03 15:24

本发明专利技术公开一种将两个声道声音信号转换成三个声道信号的方法，包括如下步骤：(1)将输入的两个声道的时域采样数据按一定的时间分辨率分帧，每帧信号按采样时间顺序排列，获得两个声道的分帧声音数据；(2)计算两个声道声音数据的协方差矩阵，并进一步计算协方差矩阵的特征值eig1和eig2，以及两个特征值对应的特征向量Vec1和Vec2；(3)由特征矢量Vec1和Vec2构造变换矩阵W；(4)通过变换矩阵W将两个声道声音数据变换为主成分数据和次成分数据；(5)由特征矢量Vec1和Vec2构造映射矩阵V；(6)通过映射矩阵V将主成分数据和次成分数据映射为三声道声音数据。本发明专利技术方法可以有效解决最佳听音区域过小和听音人运动时声像漂移的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种将两个声道声音信号转换成三个声道信号的方法，属于声音处理

技术介绍
在现实世界中，声音是在三维声场中自由传播的。为了在其他时间或地点复原某一声音场景，需要对原始的声音进行采样和编码。因客观原因的限制，声音信号在采样或编码时，只能选择较少的声道，这使声音信号在回放时，只能有限度的复原一个近似的声场。为了用有限的声道数能够获得较优的声场复原效果，人们开发出了了双声道立体声录音技术，以及5.1、7.1等更多声道的录音和回放技术。但是，录音声道数量仍然是严重受限的，不能满足要求更高的场合的应用需求。一个典型的例子是，电影院等专业音响系统普遍采用远多于录音声道数的扬声器来回放声音信号。此时，典型的做法是将扬声器分组(如左环绕扬声器组、右环绕扬声器组等)，每一组由多个扬声器组成，并馈给同一个声道声音信号(如左声道信号、右声道声音信号等)；也有将同一声道声音信号通过简单的延时和衰减馈给不同扬声器的方式。图1是一种典型的电影院扬声器布置图(实际影院还需要低频效果扬声器，并且扬声器数量会随影院大小改变)，在播放5.1环绕声时，左环绕和有环绕信号分别被馈给6个环绕扬声器；在播放7.1环绕声信号时，左环绕和右环绕信号分别馈给4个侧向的环绕扬声器，左后环绕信号馈给左后2个环绕扬声器，右后环绕信号馈给右后2个环绕扬声器。现有声音系统至少存在如下问题：(1)最佳听音区域过小；(2)听音人运动>时声像漂移。这两个问题都是由于现有的声音系统为了用较少的声道近似复原声场，采用了声音幻象原理造成的。其中，第一个问题即经常提到的皇帝位问题，即最佳听音区域，当听音人不在最佳听音区域时，原有的幻象位置被破坏并导致听觉感受的下降。第二个问题是因为原始录音是假设听音人处于理想的静态听音位置，当听音人处于运动时，导致复原声像被进一步破坏并导致听觉感受的明显下降。
技术实现思路
专利技术目的：本专利技术的目的在于针对现有技术的不足，提供一种将两个声道声音信号转换成三个声道信号的方法，通过在两个声道间增加一个中间声道，可以获得更佳的声场复原效果；具体的，本专利技术方法可以大幅度的改善原始两声道信号回放时的最佳听音区域(皇帝位)过小的问题，并且有效缓解当听音人处于运动状态时，声像位置漂移的问题。技术方案：本专利技术所述的一种将两个声道声音信号转换成三个声道信号的方法，包括如下步骤：(1)将输入的两个声道的时域采样数据按一定的时间分辨率分帧，每帧信号按采样时间顺序排列，获得两个声道的分帧声音数据；(2)计算两个声道声音数据的协方差矩阵，并进一步计算协方差矩阵的特征值eig1和eig2，以及两个特征值对应的特征向量Vec1和Vec2；(3)由特征矢量Vec1和Vec2构造变换矩阵W；(4)通过变换矩阵W将两个声道声音数据变换为主成分数据和次成分数据；(5)由特征矢量Vec1和Vec2构造映射矩阵V；(6)通过映射矩阵V将主成分数据和次成分数据映射为三声道声音数据。进一步完善上述技术方案：所述步骤(2)中假设eig1＞＝eig2，且Vec1＝[v11，v21]’，Vec1＝[v12，v22]’，其中：符号“’”为转置运算符，v11、v21和v12、v22分别为特征向量Vec1和Vec2中的两个元素，即： Vec 1 = v 11 v 21 , Vec 1 = v 12 v 22 . ]]>所述步骤(3)中所述的变换矩阵 W = Vec 1 Vec 2 = v 11 v 12 v 21 v 22 . ]]>所述步骤(4)包含如下两个子步骤：4.1由第一声道声音数据和第二声道声音数据构造矢量Sub： Sub = Sub 1 Sub 2 ]]>矢量Sub为二维矢量，其行矢量为对应声道的时序数据，列矢量为特定采样时刻的第一声道和第二声道样本；4.2将变换矩阵W的转置与矢量Sub相乘，获得矢量SubN： SubN = SubN 1 SubN 2 = W ′ × Sub ]]>其中：SubN1为主成分数据，SubN2为次成分数据；SubN1和SubN2均为行矢量。所述步骤(5)的构造过程为：首先，选择wl＝W(1，1)，wr＝W(2，1)，W(1，1)为变换矩阵W第1行第1列上的元素，W(2，1)为变换矩阵W第2行第1列上的元素；然后，通过wl和wr计算映射参数cl、cr、cc和归一化系本文档来自技高网...

【技术保护点】
一种将两个声道声音信号转换成三个声道信号的方法，其特征在于：包括如下步骤：(1)将输入的两个声道的时域采样数据按一定的时间分辨率分帧，每帧信号按采样时间顺序排列，获得两个声道的分帧声音数据；(2)计算两个声道声音数据的协方差矩阵，并进一步计算协方差矩阵的特征值eig1和eig2，以及两个特征值对应的特征向量Vec1和Vec2；(3)由特征向量Vec1和Vec2构造变换矩阵W；(4)通过变换矩阵W将两个声道声音数据变换为主成分数据和次成分数据；(5)由特征向量Vec1和Vec2构造映射矩阵V；(6)通过映射矩阵V将主成分数据和次成分数据映射为三声道声音数据。

【技术特征摘要】
1.一种将两个声道声音信号转换成三个声道信号的方法，其特征在于：包
括如下步骤：
(1)将输入的两个声道的时域采样数据按一定的时间分辨率分帧，每帧信
号按采样时间顺序排列，获得两个声道的分帧声音数据；
(2)计算两个声道声音数据的协方差矩阵，并进一步计算协方差矩阵的特
征值eig1和eig2，以及两个特征值对应的特征向量Vec1和Vec2；
(3)由特征向量Vec1和Vec2构造变换矩阵W；
(4)通过变换矩阵W将两个声道声音数据变换为主成分数据和次成分数据；
(5)由特征向量Vec1和Vec2构造映射矩阵V；
(6)通过映射矩阵V将主成分数据和次成分数据映射为三声道声音数据。
2.根据权利要求1所述的一种将两个声道声音信号转换成三个声道信号的方
法，其特征在于：所述步骤(2)中假设eig1＞＝eig2，且Vec1＝[v11，v21]’，Vec1＝[v12，
v22]’，其中符号“’”为转置运算符，v11、v21和v12、v22分别为特征向量Vec1
和Vec2中的两个元素，即：
Vec 1 = v 11 v 21 ]]> Vec 1 = v 12 v 22 ]]>3.根据权利要求2所述的一种将两个声道声音信号转换成三个声道信号的方
法，其特征在于：所述步骤(3)中所述的变换矩阵
W = Vec 1 Vec 2 = v 11 v 12 v 21 v 22 ]]>4.根据权利要求3所述的一种将两个声道声音信号转换成三个声道信号的方
法，其特征在于：所述步骤(4)包含如下两个子步骤：
4.1由第一声道声音数据和第二声道声音数据构造矢量Sub：
Sub = Sub 1 Sub 2 ]]>矢量Sub为二维矢量，其行矢量为对应声道的时序数据，列矢量为特定采
样时刻的第一声道和第二声道样本；
4.2将变换矩阵W的转置与矢量Sub相乘，获得矢量SubN：
SubN = SubN 1 SubN 2 = W ′ × Sub ]]>其中：SubN1为主成分数据，SubN2为次成分数据；SubN1和SubN2均为行
矢量。
5.根据权利要求4所述的一种将两个声道声音信号转换成三个声道信号的
方法，其特征在于：所述步骤(5)的构造过程为：
首先，选择wl＝W(1，1)，wr＝W(2，1)，W(1，1)为变换矩阵W第1行第1列
上的元素，W(2，1)为变换矩阵W第2行第1列上的元素；
然后，通过wl和wr计算映射参数cl、cr、cc和归一化系数g，且
...

【专利技术属性】
技术研发人员：潘兴德，张小新，
申请(专利权)人：南京青衿信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人