语音处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36879935 阅读:53 留言:0更新日期:2023-03-15 21:04
本申请公开了一种语音处理方法、装置、电子设备及存储介质,该方法包括:电子设备对第一音频进行划分,得到N个时间段对应的子音频,一个时间段对应一个子音频,N为正整数;在第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐第一时间段对应的第一子音频,则基于第二子音频补齐第一子音频,以得到第一时间段对应的第三子音频;将第一时间段对应的第三子音频与N个时间段中的其他时间段对应的子音频进行组合,得到第二音频;其中,第一时间段为N个时间段中的至少一个时间段;第二时间段包括以下至少之一:第一时间段之前相邻的时间段,第一时间段之后相邻的时间段。第一时间段之后相邻的时间段。第一时间段之后相邻的时间段。

【技术实现步骤摘要】
语音处理方法、装置、电子设备及存储介质


[0001]本申请属于音频
,具体涉及一种语音处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着电子设备的发展,许多电子设备应用具有发送语音消息的功能,通过传输即时或者非即时的语音消息来进行聊天或评论正日益普及。
[0003]然而,用户发送语音消息时所处的环境多样且复杂,可能会因为进入电梯、切换网络等原因,使得发送的语音消息出现卡顿、断续的情况。如此,会造成电子设备发送的语音信息缺失。

技术实现思路

[0004]本申请实施例的目的是提供一种语音处理方法、装置、电子设备及存储介质,能够解决电子设备发送的语音信息缺失的问题。
[0005]第一方面,本申请实施例提供了一种语音处理方法,该方法包括:对第一音频进行划分,得到N个时间段对应的子音频,一个时间段对应一个子音频,N为正整数;在第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐第一时间段对应的第一子音频,则基于第二子音频补齐第一子音频,以得到第一时间段对应的第三子音频;将第一时间段对应的第三子音频与N个时间段中的其他时间段对应的子音频进行组合,得到第二音频;其中,第一时间段为N个时间段中的至少一个时间段;第二时间段包括以下至少之一:第一时间段之前相邻的时间段,第一时间段之后相邻的时间段。
[0006]第二方面,本申请实施例提供了一种语音处理装置,该语音处理装置包括:处理模块和组合模块。处理模块,用于对第一音频进行划分,得到N个时间段对应的子音频,一个时间段对应一个子音频,N为正整数;并在第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐第一时间段对应的第一子音频,则基于第二子音频补齐第一子音频,以得到第一时间段对应的第三子音频。组合模块,用于将第一时间段对应的第三子音频与N个时间段中的其他时间段对应的子音频进行组合,得到第二音频;其中,第一时间段为N个时间段中的至少一个时间段;第二时间段包括以下至少之一:第一时间段之前相邻的时间段,第一时间段之后相邻的时间段。
[0007]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0008]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0009]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述
通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0010]第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
[0011]在本申请实施例中,电子设备可以对第一音频进行划分,得到N个时间段对应的子音频,以在N个时间段中的第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐该第一子音频,则电子设备基于第二子音频补齐第一子音频,以得到第一时间段对应的第三子音频;然后电子设备可以将第一时间段对应的第三子音频与N个时间段中的其他时间段对应的子音频进行组合,得到第二音频。本方案中,由于电子设备可以将待发送的第一音频划分为N个时间段对应的子音频,然后检测N个时间段对应的子音频是否存在异常语音中断,以在检测到N个时间段中的第一时间段对应的第一子音频存在异常语音中断时,确定第二时间段对应的第二子音频是否可用于补齐该第一子音频,在第二子音频可用于补齐该第一子音频时,电子设备可以基于第二子音频补齐该第一子音频,以得到处理后的第一子音频,即第一时间段对应的第三子音频;然后电子设备可以将第三子音频与N个时间段中的其他时间段对应的子音频进行组合,以得到处理后的第一音频(即第二音频),从而电子设备可以发送完整的语音信息。
附图说明
[0012]图1是本申请实施例提供的一种语音处理方法的示意图;
[0013]图2是本申请实施例提供的一种语音处理方法的流程示意图;
[0014]图3是本申请实施例提供的一种语音处理装置的结构示意图;
[0015]图4是本申请实施例提供的一种电子设备的硬件结构示意图之一;
[0016]图5是本申请实施例提供的一种电子设备的硬件结构示意图之二。
具体实施方式
[0017]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0018]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0019]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的语音处理方法进行详细地说明。
[0020]本申请实施例中的语音处理方法可以应用于补齐中断语音的场景。
[0021]目前,许多电子设备应用具有发送语音消息的功能,用户在发送语音消息时所处的环境多样且复杂,可能会因为进入电梯、切换网络、有突发环境噪声等原因使得发送出去
的语音出现断续、有杂质的情况,也可能出现语音卡顿部分片段重复等,影响语音消息接收方的内容理解以及听感体验。相关技术中,电子设备可以通过消除环境噪声来提高消息接收方对语音的可懂程度;也可以在检测到语音失真后,修复语音信息质量。但是在由于环境、网络等原因导致的语音消息卡顿、不连续时,目前已有的两种方法仍然存在处理局限性,比如:消除环境噪声的方法并不能解决语音中断的问题,并且一定程度上可能导致音质下降;检测语音失真并修复的方法虽然可以恢复失真语音的音频,但是对语音中断的情形检测即复原具有难度。如此,会造成电子设备发送的语音信息缺失。
[0022]在本申请实施例提供的方案中,电子设备可以对第一音频进行划分,得到N个时间段对应的子音频,以在N个时间段中的第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐该第一子音频,则电子设备基于第二子音频补齐第一子音频,以得到第一时间段对应的第三子音频;然后电子设备可以将第一时间段对应的第三子音频与N个时间段中的其他时间段对应的子音频进行组合,得到第二音频。本方案中,由于电子设备可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:对第一音频进行划分,得到N个时间段对应的子音频,一个时间段对应一个子音频,N为正整数;在第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频,则基于所述第二子音频补齐所述第一子音频,以得到所述第一时间段对应的第三子音频;将所述第一时间段对应的第三子音频与所述N个时间段中的其他时间段对应的子音频进行组合,得到第二音频;其中,所述第一时间段为所述N个时间段中的至少一个时间段;所述第二时间段包括以下至少之一:所述第一时间段之前相邻的时间段,所述第一时间段之后相邻的时间段。2.根据权利要求1所述的方法,其特征在于,所述对第一音频进行划分,得到N个时间段对应的子音频之后,所述方法还包括:获取所述N个时间段对应的子音频所对应的第一时域音频信号,一个时间段对应一个第一时域音频信号;将所述N个时间段对应的第一时域音频信号进行频域转换,以得到N个频域上的第一频域音频信号;所述若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频,则基于所述第二子音频补齐所述第一子音频,以得到所述第一时间段对应的第三子音频,包括:若确定所述第二时间段对应的第一频域音频信号可用于补齐所述第一时间段对应的第一频域音频信号,则基于所述第二时间段对应的第一频域音频信号补齐所述第一时间段对应的第一频域音频信号,以得到第二频域音频信号。3.根据权利要求2所述的方法,其特征在于,所述若确定所述第二时间段对应的第一频域音频信号可用于补齐所述第一时间段对应的第一频域音频信号,则基于所述第二时间段对应的第一频域音频信号补齐所述第一时间段对应的第一频域音频信号,以得到第二频域音频信号,包括:针对所述第一时间段对应的每个频段,在一个频段对应的能量差值集合中的最小能量差值小于第一阈值的情况下,确定所述第二时间段对应的第一频域音频信号可用于补齐所述第一时间段在所述一个频段上对应的第一频域音频信号;基于所述第二时间段在第一频段组上对应的第一频域音频信号,补齐所述第一时间段在所述一个频段上对应的第一频域音频信号,以得到目标第一频域音频信号;所述第一频段组为所述最小能量差值对应的频段组;将所述第一时间段在所述一个频段上对应的第一频域音频信号替换为所述目标第一频域音频信号,以得到第二频域音频信号;其中,所述能量差值集合中每个能量差值对应一组频段;所述能量差值集合中的一个能量差值为:所述第一时间段之前的X个时间段对应的第一频域音频信号在目标频段上的第一能量值,与所述第一时间段之后的X个时间段对应的第一频域音频信号在所述目标频段上的第二能量值间的差值,所述目标频段包括以下任一
项:所述一个频段、第一频段或第二频段;所述一个能量差值对应的频段组包括以下任两项:所述一个频段、所述第一频段或所述第二频段,所述第一频段和所述第二频段为所述一个频段相邻的频段。4.根据权利要求2所述的方法,其特征在于,所述将所述第一时间段对应的第三子音频与所述N个时间段中的其他时间段对应的子音频进行组合,得到第二音频,包括:将所述N个时间段对应的频域音频信号进行时域转换,得到N个时域上的第二时域音频信号;按照所述N个时间段对应的时间顺序,将所述N个时域上的第二时域音频信号进行组合,得到第二音频。5.根据权利要求1所述的方法,其特征在于,所述在第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频,则基于所述第二子音频补齐所述第一子音频,以得到所述第一时间段对应的第三子音频之前,所述方法还包括:在所述第一子音频对应的音频时域能量参数满足第一条件的情况下,确定第一子音频包含语音信息;其中,所述音频时域能量参数包括:所述第一子音频的音频时域能量,第一子音频集合中的子音频的音频平均能量,所述N个时间段对应的子音频的音频时域能量中的最小音频时域能量,所述第一子音频集合中的子音频的音频时域能量中的最小音频时域能量;所述第一子音频集合包括:所述第一子音频,和与所述第一子音频相邻的M个子音频;所述第一条件包括:所述第一子音频的音频时域能量大于所述第一子音频集合中的子音频的音频平均能量;或者,所述第一子音频的音频时域能量大于所述N个时间段对应的子音频的音频时域能量中的最小音频时域能量、且大于所述第一子音频集合中的子音频的音频时域能量中的最小音频时域能量;所述在第一时间段对应的第一子音频存在异常语音中断的情况下,若确定第二时间段对应的第二子音频可用于补齐所述第一时间段对应的第一子音频,则基于所述第二子音频补齐所述第一子音频,以得到所述第一时间段对应的第三子音频,包括:在所述第一时间段对应的第一子音频包含语音信息、且所述第一子音频存在异常语音中断的情况下,若确定所述第二时间段对应的第二子音频可用于补齐所述第一子音频,则基于所述第二子音频补齐所述第一子音频,以得到所述第一时间段对应的第三子音频。6.根据权利要求1所述的方法,其特征在于,所述对第一音频进行划分,得到N个时间段对应的子音频之后,所述方法还包括:在目标频带中的所有频段对应的第一变量的均值大于第二阈值,且所述目标频带中的所有频段对应的第二变量的均值小于第三阈值的情况下,确定所述第一时间段对应的第一子音频存在异常语音中断;其中,一个第一变量用于指示所述第一时间段对应的第一频域音频信号与第三时间段对应的第一频域音频信号在所述目标频带中的一个频段上的频谱差异性;一个第二变量用于指示所述第一时间段对应的第一频域音频信号与所述第三时间段对应的第一频域音频信号在所述目标频带中的一个频段上的频谱相似性;所述第三时间段包括:所述第一时间段之前的预定时长内的时间段,所述第一时间段
之后的所述预定时长内的时间段。7.一种语音处理装置,其特征在于,所述语音处理装置包括:处...

【专利技术属性】
技术研发人员:彭亦圆
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1