语音处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：36879935 阅读：53 留言：0更新日期：2023-03-15 21:04

本申请公开了一种语音处理方法、装置、电子设备及存储介质，该方法包括：电子设备对第一音频进行划分，得到N个时间段对应的子音频，一个时间段对应一个子音频，N为正整数；在第一时间段对应的第一子音频存在异常语音中断的情况下，若确定第二时间段对应的第二子音频可用于补齐第一时间段对应的第一子音频，则基于第二子音频补齐第一子音频，以得到第一时间段对应的第三子音频；将第一时间段对应的第三子音频与N个时间段中的其他时间段对应的子音频进行组合，得到第二音频；其中，第一时间段为N个时间段中的至少一个时间段；第二时间段包括以下至少之一：第一时间段之前相邻的时间段，第一时间段之后相邻的时间段。第一时间段之后相邻的时间段。第一时间段之后相邻的时间段。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置、电子设备及存储介质

[0001]本申请属于音频
，具体涉及一种语音处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着电子设备的发展，许多电子设备应用具有发送语音消息的功能，通过传输即时或者非即时的语音消息来进行聊天或评论正日益普及。
[0003]然而，用户发送语音消息时所处的环境多样且复杂，可能会因为进入电梯、切换网络等原因，使得发送的语音消息出现卡顿、断续的情况。如此，会造成电子设备发送的语音信息缺失。

技术实现思路

[0004]本申请实施例的目的是提供一种语音处理方法、装置、电子设备及存储介质，能够解决电子设备发送的语音信息缺失的问题。
[0005]第一方面，本申请实施例提供了一种语音处理方法，该方法包括：对第一音频进行划分，得到N个时间段对应的子音频，一个时间段对应一个子音频，N为正整数；在第一时间段对应的第一子音频存在异常语音中断的情况下，若确定第二时间段对应的第二子音频可用于补齐第一时间段对应的第一子音频，则基于第二子音频补齐第一子音频，以得到第一时间段对应的第三子音频；将第一时间段对应的第三子音频与N个时间段中的其他时间段对应的子音频进行组合，得到第二音频；其中，第一时间段为N个时间段中的至少一个时间段；第二时间段包括以下至少之一：第一时间段之前相邻的时间段，第一时间段之后相邻的时间段。
[0006]第二方面，本申请实施例提供了一种语音处理装置，该语音处理装置包括：处理模块和组合模块。处理模块，用于对第一音频进行划分，得到N个...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，其特征在于，所述方法包括：对第一音频进行划分，得到N个时间段对应的子音频，一个时间段对应一个子音频，N为正整数；在第一时间段对应的第一子音频存在异常语音中断的情况下，若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频，则基于所述第二子音频补齐所述第一子音频，以得到所述第一时间段对应的第三子音频；将所述第一时间段对应的第三子音频与所述N个时间段中的其他时间段对应的子音频进行组合，得到第二音频；其中，所述第一时间段为所述N个时间段中的至少一个时间段；所述第二时间段包括以下至少之一：所述第一时间段之前相邻的时间段，所述第一时间段之后相邻的时间段。2.根据权利要求1所述的方法，其特征在于，所述对第一音频进行划分，得到N个时间段对应的子音频之后，所述方法还包括：获取所述N个时间段对应的子音频所对应的第一时域音频信号，一个时间段对应一个第一时域音频信号；将所述N个时间段对应的第一时域音频信号进行频域转换，以得到N个频域上的第一频域音频信号；所述若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频，则基于所述第二子音频补齐所述第一子音频，以得到所述第一时间段对应的第三子音频，包括：若确定所述第二时间段对应的第一频域音频信号可用于补齐所述第一时间段对应的第一频域音频信号，则基于所述第二时间段对应的第一频域音频信号补齐所述第一时间段对应的第一频域音频信号，以得到第二频域音频信号。3.根据权利要求2所述的方法，其特征在于，所述若确定所述第二时间段对应的第一频域音频信号可用于补齐所述第一时间段对应的第一频域音频信号，则基于所述第二时间段对应的第一频域音频信号补齐所述第一时间段对应的第一频域音频信号，以得到第二频域音频信号，包括：针对所述第一时间段对应的每个频段，在一个频段对应的能量差值集合中的最小能量差值小于第一阈值的情况下，确定所述第二时间段对应的第一频域音频信号可用于补齐所述第一时间段在所述一个频段上对应的第一频域音频信号；基于所述第二时间段在第一频段组上对应的第一频域音频信号，补齐所述第一时间段在所述一个频段上对应的第一频域音频信号，以得到目标第一频域音频信号；所述第一频段组为所述最小能量差值对应的频段组；将所述第一时间段在所述一个频段上对应的第一频域音频信号替换为所述目标第一频域音频信号，以得到第二频域音频信号；其中，所述能量差值集合中每个能量差值对应一组频段；所述能量差值集合中的一个能量差值为：所述第一时间段之前的X个时间段对应的第一频域音频信号在目标频段上的第一能量值，与所述第一时间段之后的X个时间段对应的第一频域音频信号在所述目标频段上的第二能量值间的差值，所述目标频段包括以下任一
项：所述一个频段、第一频段或第二频段；所述一个能量差值对应的频段组包括以下任两项：所述一个频段、所述第一频段或所述第二频段，所述第一频段和所述第二频段为所述一个频段相邻的频段。4.根据权利要求2所述的方法，其特征在于，所述将所述第一时间段对应的第三子音频与所述N个时间段中的其他时间段对应的子音频进行组合，得到第二音频，包括：将所述N个时间段对应的频域音频信号进行时域转换，得到N个时域上的第二时域音频信号；按照所述N个时间段对应的时间顺序，将所述N个时域上的第二时域音频信号进行组合，得到第二音频。5.根据权利要求1所述的方法，其特征在于，所述在第一时间段对应的第一子音频存在异常语音中断的情况下，若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频，则基于所述第二子音频补齐所述第一子音频，以得到所述第一时间段对应的第三子音频之前，所述方法还包括：在所述第一子音频对应的音频时域能量参数满足第一条件的情况下，确定第一子音频包含语音信息；其中，所述音频时域能量参数包括：所述第一子音频的音频时域能量，第一子音频集合中的子音频的音频平均能量，所述N个时间段对应的子音频的音频时域能量中的最小音频时域能量，所述第一子音频集合中的子音频的音频时域能量中的最小音频时域能量；所述第一子音频集合包括：所述第一子音频，和与所述第一子音频相邻的M个子音频；所述第一条件包括：所述第一子音频的音频时域能量大于所述第一子音频集合中的子音频的音频平均能量；或者，所述第一子音频的音频时域能量大于所述N个时间段对应的子音频的音频时域能量中的最小音频时域能量、且大于所述第一子音频集合中的子音频的音频时域能量中的最小音频时域能量；所述在第一时间段对应的第一子音频存在异常语音中断的情况下，若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频，则基于所述第二子音频补齐所述第一子音频，以得到所述第一时间段对应的第三子音频，包括：在所述第一时间段对应的第一子音频包含语音信息、且所述第一子音频存在异常语音中断的情况下，若确定所述第二时间段对应的第二子音频可用于补齐所述第一子音频，则基于所述第二子音频补齐所述第一子音频，以得到所述第一时间段对应的第三子音频。6.根据权利要求1所述的方法，其特征在于，所述对第一音频进行划分，得到N个时间段对应的子音频之后，所述方法还包括：在目标频带中的所有频段对应的第一变量的均值大于第二阈值，且所述目标频带中的所有频段对应的第二变量的均值小于第三阈值的情况下，确定所述第一时间段对应的第一子音频存在异常语音中断；其中，一个第一变量用于指示所述第一时间段对应的第一频域音频信号与第三时间段对应的第一频域音频信号在所述目标频带中的一个频段上的频谱差异性；一个第二变量用于指示所述第一时间段对应的第一频域音频信号与所述第三时间段对应的第一频域音频信号在所述目标频带中的一个频段上的频谱相似性；所述第三时间段包括：所述第一时间段之前的预定时长内的时间段，所述第一时间段
之后的所述预定时长内的时间段。7.一种语音处理装置，其特征在于，所述语音处理装置包括：处...

【专利技术属性】
技术研发人员：彭亦圆，
申请(专利权)人：维沃移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人