语音信号处理方法、装置、计算设备及存储介质制造方法及图纸

技术编号：37432718 阅读：23 留言：0更新日期：2023-05-05 19:47

本公开提供了一种语音信号处理方法，其包括：获取语音信号的至少一个代表语音帧；获取所述至少一个代表语音帧中各代表语音帧对应的功率谱信息以及基音频率；当基于各代表语音帧对应的基音频率和功率谱信息确定所述语音信号的音质受损时，确定所述语音信号被阻隔物阻隔；以及，当确定所述语音信号被阻隔物阻隔时，对所述语音信号进行补偿。此外，本公开还涉及一种语音信号处理装置、一种计算设备以及一种计算机可读存储介质。种计算机可读存储介质。种计算机可读存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
语音信号处理方法、装置、计算设备及存储介质

[0001]本公开涉及计算机
，具体地，涉及一种用于语音信号受阻情况的语音信号处理方法、语音信号处理装置、计算设备以及计算机可读存储介质。

技术介绍

[0002]目前，语音通话应用日益普遍。然而，在一些应用场景中，语音信号可能会被阻隔物阻隔，导致其音质可能会受到损害。例如，在疫情期间，公共卫生安全问题越来越受重视，为了防止病毒传播和避免病毒感染，戴口罩已经成为日常生活中的一种必要的行为方式。然而，在戴口罩的情况下，由于嘴巴受口罩遮挡，说话时声音被口罩阻隔，因此相比不戴口罩时，说话的声音会显得发闷。如果在戴口罩的情况下进行语音通话，说话声音经过语音编解码和网络传输后，会导致其语音可懂度受到很大影响，使得接收语音信号的用户难以听清、听懂该语音信号表达的内容，严重影响语音通话的体验和效果。现有的语音通话应用没有考虑语音信号被阻隔物阻隔的情形（例如，用户戴口罩的场景），所以常规的语音增强方法，例如回声消除、噪声抑制、音量增强等，在这种场景下无法发挥作用。

技术实现思路

>[0003]根据本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音信号处理方法，其包括：获取语音信号的至少一个代表语音帧；获取所述至少一个代表语音帧中各代表语音帧对应的功率谱信息以及基音频率；当基于各代表语音帧对应的基音频率和功率谱信息确定所述语音信号的音质受损时，确定所述语音信号被阻隔物阻隔；当确定所述语音信号被阻隔物阻隔时，对所述语音信号进行补偿。2.根据权利要求1所述的语音信号处理方法，其中，所述获取语音信号的至少一个代表语音帧包括：获取所述语音信号的多个活跃语音帧；对所述多个活跃语音帧进行傅里叶变换，得到所述多个活跃语音帧中各活跃语音帧对应的功率谱信息；基于所述各活跃语音帧对应的功率谱信息，得到所述各活跃语音帧对应的中低频带能量值；基于所述各活跃语音帧对应的中低频带能量值，从所述多个活跃语音帧中确定所述至少一个代表语音帧。3.根据权利要求2所述的语音信号处理方法，其中，所述获取所述语音信号的多个活跃语音帧包括：对所述语音信号进行语音活跃检测，得到所述语音信号的多个活跃语音帧，其中，每一个活跃语音帧均包括人的声音且具有预设的时间段长度。4.根据权利要求2所述的语音信号处理方法，其中，所述基于所述各活跃语音帧对应的中低频带能量值，从所述多个活跃语音帧中确定所述至少一个代表语音帧，包括：当所述低频带能量值大于预设的中低频带能量阈值时，将所述中低频带能量值对应的活跃语音帧确定为代表语音帧。5.根据权利要求2所述的语音信号处理方法，其中，所述基于所述各活跃语音帧对应的中低频带能量值，从所述多个活跃语音帧中确定所述至少一个代表语音帧，包括：基于所述各活跃语音帧对应的中低频带能量值，对所述多个活跃语音帧进行排序；基于所述排序的结果，从所述多个活跃语音帧中确定所述至少一个代表语音帧。6.根据权利要求5所述的语音信号处理方法，其中，所述基于所述排序的结果，从所述多个活跃语音帧中确定所述至少一个代表语音帧，包括：从最大的中低频带能量值对应的活跃语音帧开始，按照中低频带能量值依次减小的顺序，根据预设的数量，从所述多个活跃语音帧中选择代表语音帧。7.根据权利要求5所述的语音信号处理方法，其中，所述基于所述排序的结果，从所述多个活跃语音帧中确定所述至少一个代表语音帧，包括：从最大的中低频带能量值对应的活跃语音帧开始，按照中低频带能量值依次减小的顺序，根据预设的百分比，从所述多个活跃语音帧中选择代表语音帧。8.根据权利要求2所述的语音信号处理方法，其中，所述获取所述至少一个代表语音帧对应的基音频率包括：对所述多个活跃语音帧进行基音频率检测，以得到各活跃语音帧对应的基音频率。9. 根据权利要求1所述的语音信号处理方法，其中，所述当确定所述语音信号被阻隔
物阻隔时，对所述语音信号进行补偿，包括：基于所述基音频率，确定对应于各频带的补偿增益；以及利用所述补偿增益，对所述语音信号进行语音增强处理。10.根据权利要求9所述的语音信号处理方法，其中，所述基于所述基音频率，确定对应于各频带的增益，包括：将基音频率范围划分为多个基音区间，并且确定所述多个基音区间中各基音区间的区间增益；确定所述基音...

【专利技术属性】
技术研发人员：梁俊斌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人