用于智能办公的语音数据增强优化方法技术

技术编号:41178729 阅读:15 留言:0更新日期:2024-05-07 22:13
本申请涉语音增强技术领域,提出了用于智能办公的语音数据增强优化方法,包括:获取每个阵元采集的语音信号;基于语音信号的Mel谱图上所有点能量值的聚类结果确定谱图覆盖模糊评估因子;基于每帧语音信号包络的波动特征确定包络受噪随机影响系数;基于谱图覆盖模糊评估因子、包络受噪随机影响系数确定声纹模糊均衡系数;基于说话人情绪稳定性对语音信号的影响程度以及韵律特征的分析结果确定控制发音行为约束因子;基于声纹模糊均衡系数、控制发音行为约束因子确定动态优化因子;采用WPE算法基于动态优化因子得到语音信号的增强结果。本申请通过改进WPE算法提高了语音信号的增强效果。

【技术实现步骤摘要】

本申请涉及语音增强,具体涉及用于智能办公的语音数据增强优化方法


技术介绍

1、随着语音识别技术的发展,以及语音识别技术的便捷性,由语音助手等语音识别软件辅助控制的软件、设备逐渐在多种办公场景中使用。例如,使用语音助手进行日程管理,使用语音助手进行文本翻译、语言翻译等;具有语音转写、语音识别等功能的智能办公本、智能录音笔等设备极大地提高了办公效率。

2、智能办公的场景中对语音信号的接收和处理至关重要,因为办公场景中除去用于沟通和控制的语音外,还包括设备移动、背景音、环境噪声等多种声音,这些会影响智能办公设备对说话人发出的语音指令的接收效果,因此在智能办公中涉及到语音信号处理时通常需要对语音信号进行增强。而传统的语音增强方法一般是对含噪语音进行处理,逼近干净语音,这类方法在会由于对语音的过抑制从而引入额外的失真,导致复杂环境中增强效果大幅度降低。例如,加权预测误差wpe(weighted prediction error)算法是一种用于自适应滤波和信号处理的算法。它在最小均方误差mmse(minimum mean square error)准则下本文档来自技高网...

【技术保护点】

1.用于智能办公的语音数据增强优化方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述用于智能办公的语音数据增强优化方法,其特征在于,所述基于每个阵元采集的语音信号的Mel谱图上所有点能量值的聚类结果确定每帧语音信号的谱图覆盖模糊评估因子的方法为:

3.根据权利要求1所述用于智能办公的语音数据增强优化方法,其特征在于,所述基于每个阵元采集的语音信号中每帧语音信号包络的波动特征确定每帧语音信号的包络受噪随机影响系数的方法为:

4.根据权利要求3所述用于智能办公的语音数据增强优化方法,其特征在于,所述基于每帧语音信号的包络上所有峰值点所确定的水平...

【技术特征摘要】

1.用于智能办公的语音数据增强优化方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述用于智能办公的语音数据增强优化方法,其特征在于,所述基于每个阵元采集的语音信号的mel谱图上所有点能量值的聚类结果确定每帧语音信号的谱图覆盖模糊评估因子的方法为:

3.根据权利要求1所述用于智能办公的语音数据增强优化方法,其特征在于,所述基于每个阵元采集的语音信号中每帧语音信号包络的波动特征确定每帧语音信号的包络受噪随机影响系数的方法为:

4.根据权利要求3所述用于智能办公的语音数据增强优化方法,其特征在于,所述基于每帧语音信号的包络上所有峰值点所确定的水平线获取每帧语音信号上每条水平线的波动区间统计序列的方法为:

5.根据权利要求1所述用于智能办公的语音数据增强优化方法,其特征在于,所述基于每帧语音信号的谱图覆盖模糊评估因子、包络受噪随机影响系数确定每帧语音信号的声纹模糊均衡系数的方法为:

6.根据权利要求1所述用于智能办公的语音数据增强优化方法,其特征在...

【专利技术属性】
技术研发人员:罗慧平周军飞蔡方德
申请(专利权)人:深圳市西昊智能家具有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1