分布式语音增强方法和语音增强装置制造方法及图纸

技术编号:37983571 阅读:8 留言:0更新日期:2023-06-30 09:58
本公开提供了一种分布式语音增强方法和语音增强装置。该方法包括根据语音参数集构建最优通信概率函数,其中,语音参数集包括权衡因子、更新矩阵第二大特征值和平均传输能耗,平均传输能耗表征在多个节点之间进行语音传输时信号能量的损耗,多个节点包括语音主节点和多个语音辅节点;对最优通信概率函数进行求解,得到节点对通信概率矩阵,其中,节点对通信概率矩阵表征语音主节点选择任意一个语音辅节点构成节点对的概率;基于节点对通信概率矩阵,利用预设处理规则对语音主节点和多个语音辅节点接收的多个声音信号进行处理,得到波束形成信号模型;将从语音主节点获取的输入语音信息输入至波束形成信号模型,输出增强语音信息。息。息。

【技术实现步骤摘要】
分布式语音增强方法和语音增强装置


[0001]本公开涉及语音信号处理
,更具体地,涉及一种分布式语音增强方法、语音增强装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]近年来,多通道语音增强技术被广泛地应用于智能会议、车载语音系统等场景。麦克风阵列可以采集空间中特定方向的语音信号,不同应用场景可以选择合适的几何排列方式,自适应地对波束方向进行控制,使阵列对来自于不同方向的声源信号进行采集。
[0003]麦克风阵列采集的声音信号不仅包含目标说话人语音,而且包含环境噪声、混响、多说话人干扰等,这些干扰信号会严重影响目标语音信号的可理解度,因此前端语音增强在很多语音信号处理系统中对于提升语音信号质量非常有必要。然而,传统麦克风阵列的空间信号采集能力非常有限,特别是当阵列距离说话人较远时,而且有线方式形成的麦克风阵列制约了阵型可拓展性。
[0004]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:无线声学传感器网络在进行语音信息的传输时,在获得语音信号质量较好的增强语音时传感器网络的能量消耗较大。

技术实现思路

[0005]有鉴于此,本公开实施例提供了一种分布式语音增强方法、语音增强装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]本公开实施例的一个方面提供了一种分布式语音增强方法,包括:
[0007]根据语音参数集构建最优通信概率函数,其中,上述语音参数集包括权衡因子、更新矩阵第二大特征值和平均传输能耗,上述平均传输能耗表征在多个节点之间进行语音传输时信号能量的损耗,多个节点包括语音主节点和多个语音辅节点;
[0008]对上述最优通信概率函数进行求解,得到节点对通信概率矩阵,其中,上述节点对通信概率矩阵表征语音主节点选择任意一个语音辅节点构成节点对的概率;
[0009]基于上述节点对通信概率矩阵,利用预设处理规则对上述语音主节点和多个上述语音辅节点接收的多个声音信号进行处理,得到波束形成信号模型;
[0010]将从上述语音主节点获取的输入语音信息输入至上述波束形成信号模型,输出增强语音信息。
[0011]根据本公开的实施例,上述根据语音参数集构建最优通信概率函数,包括:
[0012]根据多个上述节点构成的传感器网络,生成节点无向图;
[0013]基于上述节点无向图,根据N维单位矩阵、N维列向量,生成平均通信矩阵;
[0014]根据上述平均通信矩阵和节点状态初始列向量,生成列向量迭代表达式;
[0015]在上述列向量迭代表达式的第一迭代次数满足第一迭代次数阈值的情况下,将上述列向量迭代表达式的迭代结果作为上述更新矩阵第二大特征值,其中,上述迭代结果表
征上述列向量迭代表达式在迭代中生成的更新矩阵的次最大特征值;
[0016]根据上述权衡因子、上述更新矩阵第二大特征值和上述平均传输能耗,构建表征能量感知随机流言算法的上述最优通信概率函数。
[0017]根据本公开的实施例,上述平均传输能耗是通过如下方式确定的:
[0018]确定每一个上述节点对中两个节点之间的欧拉距离;
[0019]根据多个上述欧拉距离,生成节点对距离平方矩阵;
[0020]根据上述更新矩阵和上述节点对距离平方矩阵,生成上述平均传输能耗。
[0021]根据本公开的实施例,上述最优通信概率函数如以下公式所示:
[0022][0023]其中,P表征待求解的节点对通信概率矩阵,α表征预设的权衡因子,表征更新矩阵第二大特征值,λ2表征取第二大特征值,表征更新矩阵,D表征节点对距离平方矩阵,表征平均传输能耗。
[0024]根据本公开的实施例,上述基于上述节点对通信概率矩阵,利用预设处理规则对上述语音主节点和多个上述语音辅节点接收的多个声音信号进行处理,得到波束形成信号模型,包括:
[0025]对多个上述声音信号进行短时傅里叶变换,得到系数集合,其中,上述系数集合包括节点傅里叶系数子集、纯净语音傅里叶系数子集、噪声傅里叶系数子集;
[0026]根据上述系数集合和转向向量集合,构建矢量信号模型,其中,上述转向向量集合是根据与每个上述声音信号对应的初始声传递函数生成的;
[0027]根据上述矢量信号模型和目标协方差矩阵,生成上述波束形成信号模型。
[0028]根据本公开的实施例,上述声音信号是根据声源信号、上述初始声传递函数和噪声生成的;
[0029]其中,上述对多个上述声音信号进行短时傅里叶变换,得到系数集合,包括:
[0030]对多个上述声音信号进行短时傅里叶变换,得到频域上与每个上述声音信号对应的节点傅里叶系数、纯净语音傅里叶系数、噪声傅里叶系数和目标声传递函数;
[0031]基于多个上述节点傅里叶系数、多个上述纯净语音傅里叶系数、多个上述噪声傅里叶系数和多个上述目标声传递函数,分别构建上述节点傅里叶系数子集、上述纯净语音傅里叶系数子集、上述噪声傅里叶系数子集和上述转向向量集合。
[0032]根据本公开的实施例,上述根据上述矢量信号模型和目标协方差矩阵,生成上述波束形成信号模型,包括:
[0033]基于上述矢量信号模型,对预设的信号协方差矩阵进行求逆处理,得到初始波束形成迭代表达式,其中,上述初始波束形成迭代表达式表征上述目标协方差矩阵;
[0034]对上述初始波束形成迭代表达式进行两次迭代处理,分别得到第一瞬时估计平均值和第二瞬时估计平均值;
[0035]将上述第一瞬时估计平均值和上述第二瞬时估计平均值代入上述初始波束形成迭代表达式,得到目标波束形成表达式;
[0036]根据上述目标波束形成表达式和上述转向向量集合,生成上述波束形成信号模型。
[0037]根据本公开的实施例,上述对上述初始波束形成迭代表达式进行两次迭代处理,分别得到第一瞬时估计平均值和第二瞬时估计平均值,包括:
[0038]在上述初始波束形成迭代表达式的第二迭代次数满足第二迭代次数阈值的情况下,根据上述矢量信号模型和第一中间波束形成表达式,确定第一瞬时估计平均值,其中,上述第一中间波束形成表达式是对第二迭代后的初始波束形成迭代表达式进行求逆处理得到的;
[0039]在上述初始波束形成迭代表达式的第三迭代次数满足第三迭代次数阈值的情况下,根据上述矢量信号模型和第二中间波束形成表达式,确定第二瞬时估计平均值,其中,上述第二中间波束形成表达式是对第三迭代后的初始波束形成迭代表达式进行求逆处理得到的。
[0040]根据本公开的实施例,上述根据上述目标波束形成表达式和上述转向向量集合,生成上述波束形成信号模型,包括:
[0041]根据上述目标波束形成表达式和上述转向向量集合,生成第一共识向量;
[0042]根据上述第一共识向量和上述转向向量集合,生成第二共识向量;
[0043]根据上述第一共识向量和上述第二共识向量,生成上述波束形成信号模型。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式语音增强方法,包括:根据语音参数集构建最优通信概率函数,其中,所述语音参数集包括权衡因子、更新矩阵第二大特征值和平均传输能耗,所述平均传输能耗表征在多个节点之间进行语音传输时信号能量的损耗,多个节点包括语音主节点和多个语音辅节点;对所述最优通信概率函数进行求解,得到节点对通信概率矩阵,其中,所述节点对通信概率矩阵表征语音主节点选择任意一个语音辅节点构成节点对的概率;基于所述节点对通信概率矩阵,利用预设处理规则对所述语音主节点和多个所述语音辅节点接收的多个声音信号进行处理,得到波束形成信号模型;将从所述语音主节点获取的输入语音信息输入至所述波束形成信号模型,输出增强语音信息。2.根据权利要求1所述的方法,其中,所述根据语音参数集构建最优通信概率函数,包括:根据多个所述节点构成的传感器网络,生成节点无向图;基于所述节点无向图,根据N维单位矩阵、N维列向量,生成平均通信矩阵;根据所述平均通信矩阵和节点状态初始列向量,生成列向量迭代表达式;在所述列向量迭代表达式的第一迭代次数满足第一迭代次数阈值的情况下,将所述列向量迭代表达式的迭代结果作为所述更新矩阵第二大特征值,其中,所述迭代结果表征所述列向量迭代表达式在迭代中生成的更新矩阵的第二最大特征值;根据所述权衡因子、所述更新矩阵第二大特征值和所述平均传输能耗,构建基于能量感知随机流言算法的所述最优通信概率函数。3.根据权利要求2所述的方法,其中,所述平均传输能耗是通过如下方式确定的:确定每一个所述节点对中两个节点之间的欧拉距离;根据多个所述欧拉距离,生成节点对距离平方矩阵;根据所述更新矩阵和所述节点对距离平方矩阵,生成所述平均传输能耗。4.根据权利要求1~3中任一项所述的方法,其中,所述最优通信概率函数如公式(1)所示:其中,P表征待求解的节点对通信概率矩阵,α表征预设的权衡因子,表征更新矩阵第二大特征值λ2表征取第二大特征值,表征更新矩阵,D表征节点对距离平方矩阵,表征平均传输能耗。5.根据权利要求1所述的方法,其中,所述基于所述节点对通信概率矩阵,利用预设处理规则对所述语音主节点和多个所述语音辅节点接收的多个声音信号进行处理,得到波束形成信号模型,包括:对多个所述声音信号进行短时傅里叶变换,得到系数集合,其中,所述系数集合包括节点傅里叶系数子集、纯净语音傅里叶系数子集、噪声傅里叶系数子集;根据所述系数集合和转向向量集合,构建矢量信号模型,其中,所述转向向量集合是根据与每个所述声音信号对应的初始声传递函数生成的;根据所述矢量信号模型和目标协方差矩阵,生成所述波束形成信号模型。
6.根据权利要求5所述的方法,所述声音信号是根据声源信号、所述初始声传递函数和噪声生成的;其中,所述对多个所述声音信号进行短时傅里叶变换,得到系数集合,包括:对多个所述声音信号进行短时傅里叶变换,得到频域上与每个所...

【专利技术属性】
技术研发人员:张结许露真戴礼荣
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1