语音增强方法及装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:24582833 阅读:41 留言:0更新日期:2020-06-21 01:21
本公开提供一种语音增强方法、装置以及电子设备和计算机可读存储介质,该方法包括:获取干净语音样本;分解所述干净语音样本获得第一稀疏矩阵和m个基矩阵,其中所述第一稀疏矩阵中的值均为正数,m为大于1的正整数;根据所述第一稀疏矩阵和目标神经网络的权重矩阵,获得所述目标神经网络的可视层神经元状态向量;根据所述可视层神经元状态向量和所述干净语音样本更新所述权重矩阵,以获取用于语音增强的深度字典。本公开实施例提供的技术方案能够通过在目标神经网络中引入深度分解后的第一稀疏矩阵,获得可以表征干净语音样本的深度特征的深度字典。

Speech enhancement methods and devices, electronic equipment and computer readable storage media

【技术实现步骤摘要】
语音增强方法及装置、电子设备和计算机可读存储介质
本公开涉及语音降噪
,尤其涉及一种语音增强方法及装置、电子设备和计算机可读存储介质。
技术介绍
语音是人类最便捷和自然的交流工具之一,它既可以消除人与人之间交流的距离隔阂,又可以提高人与机器之间交互的效率。然而,现实环境中无处不在的噪声不同程度地影响着语音交流的质量。例如,在丰富的游戏场景中,用户在嘈杂环境中使用游戏语音时麦克风会会采集到的各类环境噪音,而且在多人的组队语音中,一方受到噪声干扰,将影响整个组队成员中的通话质量。因此,语音增强对于游戏语音来说是一个重要的课题。传统的语音降噪算法基于统计分析,假设噪音信号相对语音是缓慢变换的。但是,由于复杂环境下噪声的丰富性,当假设和实时不符合时,算法效果不会符合预期效果。因此一种泛化能力好、可以将带噪语音高质量恢复的方法对于语音增强领域至关重要。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。专利技术内容本公开本文档来自技高网...

【技术保护点】
1.一种语音增强方法,其特征在于,包括:/n获取干净语音样本;/n分解所述干净语音样本获得第一稀疏矩阵和m个基矩阵,其中所述第一稀疏矩阵中的值均为正数,m为大于1的正整数;/n根据所述第一稀疏矩阵和目标神经网络的权重矩阵,获得所述目标神经网络的可视层神经元状态向量;/n根据所述可视层神经元状态向量和所述干净语音样本更新所述权重矩阵,以获取用于语音增强的深度字典。/n

【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:
获取干净语音样本;
分解所述干净语音样本获得第一稀疏矩阵和m个基矩阵,其中所述第一稀疏矩阵中的值均为正数,m为大于1的正整数;
根据所述第一稀疏矩阵和目标神经网络的权重矩阵,获得所述目标神经网络的可视层神经元状态向量;
根据所述可视层神经元状态向量和所述干净语音样本更新所述权重矩阵,以获取用于语音增强的深度字典。


2.根据权利要求1所述方法,其特征在于,所述目标神经网络包括第一偏置项;其中,根据所述第一稀疏矩阵和目标神经网络的权重矩阵,获得所述目标神经网络的可视层神经元状态向量,包括:
根据所述第一稀疏矩阵、所述目标神经网络的权重矩阵以及所述第一偏置项确定所述目标神经网络的可视层条件概率;
根据所述可视层条件概率确定所述可视层神经元状态变量。


3.根据权利要求2所述方法,其特征在于,所述目标神经网络还包括第二偏置项;其中,根据所述可视层神经元状态向量和所述干净语音样本更新所述权重矩阵,以获取用于语音增强的深度字典,包括:
根据所述权重矩阵、所述干净语音样本以及所述第二偏置项确定所述目标神经网络的第一隐藏层条件概率;
根据所述权重矩阵、所述可视层神经元状态向量以及所述第二偏置项确定所述目标神经网络的第二隐藏层条件概率;
根据所述第一隐藏层条件概率、所述第二隐藏层条件概率、所述干净语音样本以及所述可视层神经元状态向量更新所述权重矩阵。


4.根据权利要求3所述方法,其特征在于,根据所述可视层神经元状态向量和所述干净语音样本更新所述权重矩阵,以获取用于语音增强的深度字典,还包括:
根据所述干净语音样本和所述可视层神经元状态向量更新所述第一偏置项;
根据所述第一隐藏层条件概率和所述第二隐藏层条件概率更新所述第二偏置项。


5.根据权利要求1所述方法,其特征在于,所述m个基矩阵包括第一基矩阵、第二基矩阵,其中分解所述干净语音样本获得稀疏矩阵和m个基矩阵,其中所述稀疏矩阵中的值均为正数,包括:
通过对所述干净语音样本进行半非负矩阵求解,以确定所述第一基矩阵和第一目标矩阵;
通过对所述第一目标矩阵进行半非负矩阵求解,以初始化所述第二基矩阵和第二目标矩阵;
根据所述第一基矩阵、所述第二基矩阵确定基矩阵变量;
通过基矩阵更新函数对所述基矩阵变量、所述干净语音样本以及所述第二目标矩阵进行处理,更新所述第二基矩阵;
通过稀疏矩阵更新函数对所述基矩阵变量和所述干净语音样本进行处理,更新所述第二目标矩阵,所述第二目标矩阵为所述第一稀疏矩阵。


6.一种语音增强方法,其特征在于,包括:
获取待增强语音;
根据权利要求1-5任一所述方法获取用于语音增强的深度字典;
根据所述深度字典对所述待增强语音进行深度展开,确定所述待增强语音的第二稀疏矩阵;
根据所述第二稀疏矩阵和所述深度字典确定所述待增强语音的干净语音。


7.根据权利要求6所述方法,其特征在于,根据所述深度字典对所述待增强语音进行深度展开,确定所述待增强语音的第二稀疏矩阵,包括:
获取所述待增强语音的第二稀疏矩阵;
根据所述深度字典、所述第二稀疏矩阵确定第一软阈值;
根据所述第二稀疏矩阵、所述深度字典以及所述第...

【专利技术属性】
技术研发人员:方雪飞崔晓春李从兵刘晓宇曹木勇余涛杨栋周荣鑫李文焱
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1