基于语音处理的语音增强方法及相关设备技术

技术编号：22078711 阅读：44 留言：0更新日期：2019-09-12 15:11

本发明专利技术涉及人工智能领域，尤其涉及一种基于语音处理的语音增强方法及相关设备，基于语音处理的语音增强方法包括：获取原始语音信号，将原始语音信号依次输入滤波器和麦克风阵列，得到原始语音信号的固定波束麦克风阵列；根据固定波束麦克风阵列，将原始语音信号分割成N个子空间语音信号；从每一子空间语音信号中提取若干唤醒词，并进行分帧加窗处理；根据每一子空间语音信号对应的分帧加窗处理后的唤醒词，计算对应子空间语音信号的置信度；根据置信度的计算结果，选取置信度最高的子空间语音信号作为最终输出语音信号。本发明专利技术分散了噪音的方向性，减少了噪音的方向数量，提取有效语音较强且噪音较弱的子空间语音信号，从而达到语音增强的效果。

Speech Enhancement Method and Related Equipment Based on Speech Processing

全部详细技术资料下载

【技术实现步骤摘要】
基于语音处理的语音增强方法及相关设备
本专利技术涉及人工智能
，尤其涉及一种基于语音处理的语音增强方法及相关设备。
技术介绍
随着科技的发展，智能语音对话和语音通信技术已运用到人们的日常生活当中，但是在嘈杂语音环境下，如多人会话噪声(BabbleNoise)，汽车噪声和风噪声等，都会降低语音质量，极大影响到用户体验，很多情况下容易导致语音噪音干扰用户对语音内容的理解，甚至在一些情况下影响到用户的判断。例如，在语音通信时，噪声会干扰甚至掩盖对方的声音，降低通话质量；在语音识别系统中，噪声会使得语音识别率下降，甚至使识别系统完全失效。因此，根据观测到的带噪语音信号，估计纯净语音具有十分重要的意义，我们称此为语音增强。目前，在语音对话和通信系统中，会采用多通道麦克风阵列方法进行语音增强，采用麦克风阵列进行语音增强，往往需要语音方位(甚至是噪声方位)已知。但实际情况下，由于真实环境中方向性噪声的存在，声源方位往往并不固定，且噪声和混响下的声源方位难以估计。因此，传统的基于麦克风阵列的语音增强算法在对多方向性噪声声源的语音信号进行增强时效果不佳。
技术实现思路
有鉴于此，...

【技术保护点】
1.一种基于语音处理的语音增强方法，其特征在于，包括：获取带有方向性噪音的原始语音信号，将所述原始语音信号依次输入滤波器和麦克风阵列，得到所述原始语音信号的固定波束麦克风阵列；根据所述固定波束麦克风阵列，将所述原始语音信号分割成N个子空间语音信号；从每一子空间语音信号中提取若干唤醒词，并对所述唤醒词分别进行分帧加窗处理；根据每一子空间语音信号对应的分帧加窗处理后的所述唤醒词，计算对应子空间语音信号的置信度；根据计算得到的每一子空间语音信号的置信度，选取所述置信度最高的所述子空间语音信号作为最终输出语音信号。

【技术特征摘要】
1.一种基于语音处理的语音增强方法，其特征在于，包括：获取带有方向性噪音的原始语音信号，将所述原始语音信号依次输入滤波器和麦克风阵列，得到所述原始语音信号的固定波束麦克风阵列；根据所述固定波束麦克风阵列，将所述原始语音信号分割成N个子空间语音信号；从每一子空间语音信号中提取若干唤醒词，并对所述唤醒词分别进行分帧加窗处理；根据每一子空间语音信号对应的分帧加窗处理后的所述唤醒词，计算对应子空间语音信号的置信度；根据计算得到的每一子空间语音信号的置信度，选取所述置信度最高的所述子空间语音信号作为最终输出语音信号。2.根据权利要求1所述的基于语音处理的语音增强方法，其特征在于，所述获取带有方向性噪音的原始语音信号，将所述原始语音信号依次输入滤波器和麦克风阵列，得到所述原始语音信号的固定波束麦克风阵列，包括：获取带有方向性噪音的原始语音信号；将所述原始语音信号输入所述滤波器，进行固定波束形成计算，所述固定波束形成计算公式如下：其中，k为频点，c为原始语音信号的帧编号，Zc(k)为c的固定波速，为原始语音信号，为滤波器的系数，每帧的滤波器的系数为预设的不同常数，H为帧的数量；将经过固定波速形成计算的所述原始语音信号输入所述麦克风阵列，得到所述原始语音信号的固定波束麦克风阵列。3.根据权利要求1所述的基于语音处理的语音增强方法，其特征在于，所述根据所述固定波束麦克风阵列，将所述原始语音信号分割成N个子空间语音信号，包括：将所述固定波束麦克风阵列划分为N个子阵列；给所有子阵列中的每一向量赋予不同的权重，根据所述权重计算每一子阵列的方向性加权向量，每一所述方向性加权向量为对应子阵列的中心指向性向量；以每一所述方向性加权向量的指向为分割依据，将所述原始语音信号分割成N个子空间语音信号。4.根据权利要求1所述的基于语音处理的语音增强方法，其特征在于，所述从每一子空间语音信号中提取若干唤醒词，并对所述唤醒词分别进行分帧加窗处理，包括：将所述子空间语音信号按照预设的语音分析时长分割成若干语音子片段，对每一语音子片段进行傅里叶变换，得到每一语音子片段的声音频谱，其中，傅里叶变换的公式为：上式中，Y(n)表示经过傅里叶变换后的声音频谱，y(n)表示原声音频谱，f表示频率分辨率，n表示声波波长，N表示汉宁窗长度；将每一语音子片段的声音频谱放在同一个坐标系下，所述坐标系以频率为横坐标，以振幅为纵坐标；提取纵坐标大于预设阈值的所述声音频谱对应的语音子片段作为所述唤醒词，并对所述唤醒词分别进行分帧加窗处理。5.根据权利要求1所述的基于语音处理的语音增强方法，其特征在于，所述根据每一子空间语音信号对应的分帧加窗处理后的所述唤醒词，计算对应子空...

【专利技术属性】
技术研发人员：赵建平，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人