不须计算取样频率误差的盲源分离方法以及音频处理系统技术方案

技术编号:34778108 阅读:22 留言:0更新日期:2022-09-03 19:30
本揭露提出一种不须计算取样频率误差的盲源分离方法以及音频处理系统,盲源分离方法适用于一音频处理系统,此音频处理系统包括多个装置,每一个装置包括多个麦克风。先计算每个装置感测的信号向量与混和矩阵的一行之间的差异,此差异用来建立一目标函数,接着执行一最佳化演算法来计算混和矩阵。根据混和矩阵与信号向量可以计算出原始信号而不用计算装置之间的取样频率误差。如此一来,便不需要补偿取样频率误差。偿取样频率误差。偿取样频率误差。

【技术实现步骤摘要】
不须计算取样频率误差的盲源分离方法以及音频处理系统


[0001]本揭露是有关于非同步录音,特别的是不需要计算取样频率误差,也不需要对声音信号重新取样。

技术介绍

[0002]在音频信号处理领域中,自组(ad

hoc)麦克风阵列的使用变得越来越有用。对于盲源分离(blind source separation)的技术来说,自组麦克风阵列提供了价格合理,灵活且便携式的音频采集系统。但是,自组麦克风阵列获取的信号通常具有不同的开始时间。此外,由于录音设备之间的模拟数字转换器(analog

to

digital,ADC)彼此独立,因此每个设备上真实的取样频率与号称的取样频率略有不同。这些变异会导致信号处理演算法(例如盲源分离)明显的效能降低,因此需要进行校正。尽管存在录音前的校正方法,但在大多数录音设备上这些方法并不总是可行或方便的。因此,在实际应用中,通常是在不知道关于设置或不匹配的信息前提下,在录音后进行取样频率不匹配和起始偏移的补偿。

技术实现思路

[0003]本揭露的实施例提出一种盲源分离方法,适用于一音频处理系统。此音频处理系统包括多个装置,每一个装置包括多个麦克风。盲源分离方法包括:取得每一个装置的每一个麦克风所感测的声音信号,将每一个声音信号分为多个讯框,并对每一个讯框执行时间至频率域转换以产生在时间频率域的向量x
d
[τ,k;f
d
],其中d表示第d个装置,f
d
表示第d个装置的取样频率,τ表示第τ个讯框,k表示第k个频率系数索引;设定一混和矩阵A[k]=[A1[k;f1]T


,A
D
[k;f
D
]T
]T
,其中D表示装置的个数,矩阵A
d
[k;f1]对应至第d个装置,混和矩阵A
d
的大小为c
d
×
N,c
d
为第d个装置的麦克风的个数,N为多个信号源的个数;对于每一个信号源、每一个装置及每一个讯框,计算向量x
d
[τ,k;f
d
]与向量a
n,d
[k;f
d
]之间的差异,其中向量a
n,d
[k;f
d
]表示矩阵A
d
[k;f1]中的第n个行,n为小于等于N的正整数;根据差异建立目标函数,并根据目标函数执行最佳化演算法以计算混和矩阵;以及根据混和矩阵与向量x
d
[τ,k;f
d
]计算信号源所对应的多个原始信号,而不计算装置之间的取样频率误差。
[0004]在一些实施例中,上述的差异为向量x
d
[τ,k;f
d
]与向量a
n,d
[k;f
d
]之间的余弦相似度。
[0005]在一些实施例中,上述的盲源分离方法,还包括:根据差异计算一判别项,判别项如以下数学式所示,其中r为一实数,为向量a
n,d
[k;f
d
]的共轭转置。
[0006][0007]在一些实施例中,目标函数表示为以下数学式,其中T为讯框的个数。
[0008][0009]在一些实施例中,执行最佳化演算法的步骤包括:根据以下数学式计算目标函数的一次导数;将混和矩阵减去次导数与学习率的乘积再加上选择性的动量项以更新混和矩阵,或者将混和矩阵减去次导数与黑赛矩阵(Hessian matrix)的近似值的乘积以更新混和矩阵。
[0010][0011][0012][0013][0014][0015]在一些实施例中,目标函数表示为以下数学式。
[0016][0017]在一些实施例中,执行最佳化演算法的步骤包括:根据以下数学式计算目标函数的一次导数;将混和矩阵减去次导数与学习率的乘积再加上选择性的动量项以更新混和矩阵,或者将混和矩阵减去次导数与黑赛矩阵(Hessian matrix)的近似值的乘积以更新混和矩阵。
[0018][0019][0020][0021][0022][0023]在一些实施例中,根据混和矩阵与装置所对应的向量x
d
[τ,k;f
d
]计算信号源所对应的原始信号的步骤包括:组成一向量其中C=∑c
d
,D为装置的个数;以及将混和矩阵的反矩阵乘上向量x[τ,k]以得到原始信号,或者根据混和矩阵与向量x[τ,k]取得频率域遮罩,将频率域遮罩乘上向量x[τ,k]以得到原始信号。
[0024]以另一个角度来说,本揭露的实施例提出一种音频处理系统,包括:多个装置,每一个装置包括多个麦克风,每一个装置的每一个麦克风用以感测一声音信号;以及一服务器,上述的装置与服务器用以执行多个步骤:(a)将每一个声音信号分为多个讯框,并对每一个讯框执行一时间至频率域转换以产生在一时间频率域的向量x
d
[τ,k;f
d
],其中d表示第d个装置,f
d
表示第d个装置的取样频率,τ表示第τ个讯框,k表示第k个频率系数索引;(b)设定一混和矩阵A[k]=[A1[k;f1]T
,...,A
D
[k;f
D
]T
]T
,其中D表示装置的个数,矩阵A
d
[k;f1]对应至第d个装置,矩阵A
d
的大小为c
d
×
N,c
d
为第d个装置的麦克风的个数,N为多个信号源的个数;(c)对于每一个信号源、每一个装置及每一个讯框,计算向量x
d
[τ,k;f
d
]与一向量a
n,d
[k;f
d
]之间的一差异,其中向量a
n,d
[k;f
d
]表示矩阵A
d
[k;f1]中的第n个行,n为小于等于N的正整数;(d)根据差异建立一目标函数,并根据目标函数执行一最佳化演算法以计算混和矩阵;以及(e)根据混和矩阵与装置所对应的向量x
d
[τ,k;f
d
]计算信号源所对应的多个原始信号,而不计算装置之间的取样频率误差。
[0025]在一些实施例中,装置将声音信号传送至服务器,由服务器执行步骤(a)~(e)。
[0026]在一些实施例中,装置执行步骤(a)~(c)以计算出多个判别项,并且将这些判别项传送至服务器。服务器根据判别项计算至少一讯框索引,并将至少一讯框索引传送至装置以更新混和矩阵。
附图说明
[0027]为让本专利技术的上述特征和优点能更明显易懂,下文特举实施例,并配合所附附图作详细说明如下。
[0028]图1是根据一些实施例绘示音频处理系统的示意图;
[0029]图2是根据一些实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种盲源分离方法,适用于一音频处理系统,该音频处理系统包括多个装置,每一所述装置包括多个麦克风,其特征在于,该盲源分离方法包括:取得每一所述装置的每一所述麦克风所感测的一声音信号,将每一所述声音信号分为多个讯框,并对每一所述讯框执行一时间至频率域转换以产生在一时间频率域的向量x
d
[τ,k;f
d
],其中d表示所述多个装置中的第d个装置,f
d
表示该第d个装置的取样频率,τ表示所述多个讯框中的第τ个讯框,k表示第k个频率系数索引;设定一混和矩阵A[k]=[A1[k,f1]
T
,...,A
D
[k;f
D
]
T
]
T
,其中D表示所述多个装置的个数,矩阵A
d
[k;f1]对应至该第d个装置,该混和矩阵A
d
的大小为c
d
×
N,c
d
为该第d个装置的所述多个麦克风的个数,N为多个信号源的个数;对于每一所述信号源、每一所述装置及每一所述讯框,计算该向量x
d
[τ,k;f
d
]与一向量a
n,d
[k;f
d
]之间的一差异,其中该向量a
n,d
[k;f
d
]表示该矩阵A
d
[k;f1]中的第n个行,n为小于等于N的正整数;根据所述差异建立一目标函数,并根据该目标函数执行一最佳化演算法以计算该混和矩阵;以及根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的多个原始信号,而不计算所述多个装置之间的取样频率误差。2.根据权利要求1所述的盲源分离方法,其特征在于,其中该差异为该向量x
d
[τ,k;f
d
]与该向量a
n,d
[k;f
d
]之间的余弦相似度。3.根据权利要求2所述的盲源分离方法,其特征在于,还包括:根据该差异计算一判别项,该判别项如以下数学式所示,其中r为一实数,为该向量a
n,d
[k;f
d
]的共轭转置。4.根据权利要求3所述的盲源分离方法,其特征在于,其中该目标函数表示为以下数学式,其中T为所述多个讯框的个数。5.根据权利要求4所述的盲源分离方法,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,学式计算该目标函数的一次导数,
以及将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(Hessian matrix)的近似值的乘积以更新该混和矩阵。6.根据权利要求3所述的盲源分离方法,其特征在于,其中该目标函数表示为以下数学式,其中T为所述多个讯框的个数。7.根据权利要求6所述的盲源分离方法,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,
以及将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(Hessian matrix)的近似值的乘积以更新该混和矩阵。8.根据权利要求1所述的盲源分离方法,其特征在于,其中根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的所述多个原始信号的步骤包括:组成一向量其中C=∑c
d
,D为所述多个装置的个数;以及将该混和矩阵的反矩阵乘上该向量x[τ,k]以得到所述多个原始信号,或者根据该混和矩阵与该向量x[τ,k]取得一频率域遮罩,将该频率域遮罩乘上该向量x[τ,k]以得到所述多个原始信号。9.一种音频处理系统,其特征在于,包括:多个装置,每一所述装置包括多个麦克风,其中每一所述装置的每一所述麦克风用以感测一声音信号;以及一服务器,其中所述多个装置与该服务器用以执行多个步骤:(a)将每一所述声音信号分为多个讯框,并对每一所述讯框执行一时间至频率域转换以产生在一时间频率域的向量x
d<...

【专利技术属性】
技术研发人员:阮海潮英邝伟雄
申请(专利权)人:台达电子国际新加坡私人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1