【技术实现步骤摘要】
不须计算取样频率误差的盲源分离方法以及音频处理系统
[0001]本揭露是有关于非同步录音,特别的是不需要计算取样频率误差,也不需要对声音信号重新取样。
技术介绍
[0002]在音频信号处理领域中,自组(ad
‑
hoc)麦克风阵列的使用变得越来越有用。对于盲源分离(blind source separation)的技术来说,自组麦克风阵列提供了价格合理,灵活且便携式的音频采集系统。但是,自组麦克风阵列获取的信号通常具有不同的开始时间。此外,由于录音设备之间的模拟数字转换器(analog
‑
to
‑
digital,ADC)彼此独立,因此每个设备上真实的取样频率与号称的取样频率略有不同。这些变异会导致信号处理演算法(例如盲源分离)明显的效能降低,因此需要进行校正。尽管存在录音前的校正方法,但在大多数录音设备上这些方法并不总是可行或方便的。因此,在实际应用中,通常是在不知道关于设置或不匹配的信息前提下,在录音后进行取样频率不匹配和起始偏移的补偿。
技术实现思路
[0003]本揭露的实施例提出一种盲源分离方法,适用于一音频处理系统。此音频处理系统包括多个装置,每一个装置包括多个麦克风。盲源分离方法包括:取得每一个装置的每一个麦克风所感测的声音信号,将每一个声音信号分为多个讯框,并对每一个讯框执行时间至频率域转换以产生在时间频率域的向量x
d
[τ,k;f
d
],其中d表示第d个装置,f
d
表示第d个装置的取 ...
【技术保护点】
【技术特征摘要】
1.一种盲源分离方法,适用于一音频处理系统,该音频处理系统包括多个装置,每一所述装置包括多个麦克风,其特征在于,该盲源分离方法包括:取得每一所述装置的每一所述麦克风所感测的一声音信号,将每一所述声音信号分为多个讯框,并对每一所述讯框执行一时间至频率域转换以产生在一时间频率域的向量x
d
[τ,k;f
d
],其中d表示所述多个装置中的第d个装置,f
d
表示该第d个装置的取样频率,τ表示所述多个讯框中的第τ个讯框,k表示第k个频率系数索引;设定一混和矩阵A[k]=[A1[k,f1]
T
,...,A
D
[k;f
D
]
T
]
T
,其中D表示所述多个装置的个数,矩阵A
d
[k;f1]对应至该第d个装置,该混和矩阵A
d
的大小为c
d
×
N,c
d
为该第d个装置的所述多个麦克风的个数,N为多个信号源的个数;对于每一所述信号源、每一所述装置及每一所述讯框,计算该向量x
d
[τ,k;f
d
]与一向量a
n,d
[k;f
d
]之间的一差异,其中该向量a
n,d
[k;f
d
]表示该矩阵A
d
[k;f1]中的第n个行,n为小于等于N的正整数;根据所述差异建立一目标函数,并根据该目标函数执行一最佳化演算法以计算该混和矩阵;以及根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的多个原始信号,而不计算所述多个装置之间的取样频率误差。2.根据权利要求1所述的盲源分离方法,其特征在于,其中该差异为该向量x
d
[τ,k;f
d
]与该向量a
n,d
[k;f
d
]之间的余弦相似度。3.根据权利要求2所述的盲源分离方法,其特征在于,还包括:根据该差异计算一判别项,该判别项如以下数学式所示,其中r为一实数,为该向量a
n,d
[k;f
d
]的共轭转置。4.根据权利要求3所述的盲源分离方法,其特征在于,其中该目标函数表示为以下数学式,其中T为所述多个讯框的个数。5.根据权利要求4所述的盲源分离方法,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,学式计算该目标函数的一次导数,
以及将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(Hessian matrix)的近似值的乘积以更新该混和矩阵。6.根据权利要求3所述的盲源分离方法,其特征在于,其中该目标函数表示为以下数学式,其中T为所述多个讯框的个数。7.根据权利要求6所述的盲源分离方法,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,
以及将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(Hessian matrix)的近似值的乘积以更新该混和矩阵。8.根据权利要求1所述的盲源分离方法,其特征在于,其中根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的所述多个原始信号的步骤包括:组成一向量其中C=∑c
d
,D为所述多个装置的个数;以及将该混和矩阵的反矩阵乘上该向量x[τ,k]以得到所述多个原始信号,或者根据该混和矩阵与该向量x[τ,k]取得一频率域遮罩,将该频率域遮罩乘上该向量x[τ,k]以得到所述多个原始信号。9.一种音频处理系统,其特征在于,包括:多个装置,每一所述装置包括多个麦克风,其中每一所述装置的每一所述麦克风用以感测一声音信号;以及一服务器,其中所述多个装置与该服务器用以执行多个步骤:(a)将每一所述声音信号分为多个讯框,并对每一所述讯框执行一时间至频率域转换以产生在一时间频率域的向量x
d<...
【专利技术属性】
技术研发人员:阮海潮英,邝伟雄,甘,
申请(专利权)人:台达电子国际新加坡私人有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。