语音数据的处理方法、装置、存储介质以及电子设备制造方法及图纸

技术编号:34852458 阅读:14 留言:0更新日期:2022-09-08 07:53
本申请公开了一种语音数据的处理方法、装置、存储介质以及电子设备。其中,该方法包括:确定对原始语音数据进行忙音检测时的检测顺序,以及原始语音数据待参与检测的字节大小,基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测,得到第一语音段数据;对第一语音段数据进行正弦波检测,得到检测结果,确定检测结果中满足预设条件的第一语音段数据为第二语音段数据;根据第二语音段数据对原始语音数据进行截取,得到有效音频段数据。本申请解决了由于相关技术中对录音进行保存时存在无效音频,额外占用存储空间和传输宽带,影响用户听觉体验的技术问题。影响用户听觉体验的技术问题。影响用户听觉体验的技术问题。

【技术实现步骤摘要】
语音数据的处理方法、装置、存储介质以及电子设备


[0001]本申请涉及音频信号处理领域,具体而言,涉及一种语音数据的处理方法、装置、存储介质以及电子设备。

技术介绍

[0002]在电话叫车等场景,需要对乘客上车地点进行录音,如果乘客在系统设置的录音时间内(比如9秒)提前挂机(比如6秒就挂机),录音文件会有挂机嘟嘟音(例如,表现为0.35S高

0.35S低交替的嘟嘟音),在听取此类录音时,会对听觉造成听觉冲击,体验不佳,无效音降低了使用体验,也占用了存储空间和传输带宽。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种语音数据的处理方法、装置、存储介质以及电子设备,以至少解决由于相关技术中对录音进行保存时存在无效音频,额外占用存储空间和传输宽带,影响用户听觉体验的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种语音数据的处理方法,包括:确定对原始语音数据进行忙音检测时的检测顺序,以及原始语音数据待参与检测的字节大小,基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测,得到第一语音段数据;对第一语音段数据进行正弦波检测,得到检测结果,确定检测结果中满足预设条件的第一语音段数据为第二语音段数据;根据第二语音段数据对原始语音数据进行截取,得到有效音频段数据。
[0006]可选地,对第一语音段数据进行正弦波检测,得到检测结果,确定检测结果中满足预设条件的第一语音段数据为第二语音段数据,包括:获取第一语音段数据中各个分段数据对应的各个波形;确定各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据;检测第三语音段数据对应的正弦波波形的波峰以及波谷;确定波峰出现的第一次数以及波谷出现的第二次数;确定第一次数与第二次数的第一比值,在第一比值在第一预设范围之内的情况下,确定第三语音段数据为满足预设条件的第二语音段数据。
[0007]可选地,对第一语音段数据进行正弦波检测,得到检测结果,确定检测结果中满足预设条件的第一语音段数据为第二语音段数据,包括:获取第一语音段数据中各个分段数据对应的各个波形;确定各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据;检测第三语音段数据对应的正弦波波形的波峰以及波谷;获取正弦波波形的波峰值与波谷值,确定波峰值与波谷值的第二比值,在第二比值在第二预设范围之内的情况下,确定第三语音段数据为满足预设条件的第二语音段数据。
[0008]可选地,根据第二语音段数据对原始语音数据进行截取,得到有效音频段数据,包括:确定第二语音段数据所占用的目标字节数N;根据目标字节数N对原始语音数据进行截取确定有效音频段数据。
[0009]可选地,根据目标字节数对原始语音数据进行截取确定有效音频段数据,包括:获取原始语音数据所占用的总字节数M;截取原始语音数据除语音文件头之外的前M

N个字节,得到目标段语音数据;计算目标段语音数据所占用的字节数,并对语音文件头信息进行重写,得到有效音频段数据。
[0010]可选地,在得到有效音频段数据之后,方法还包括:确定目标存储位置指示的目标存储路径,其中,目标存储位置与原始语音数据的存储位置不同;根据目标存储路径将有效音频段数据存储至目标存储位置。
[0011]可选地,待参与检测的字节大小通过如下方式确定:获取样本语音数据,其中,样本语音数据的采样频率与原始语音数据的采样频率相同,且样本语音数据中的杂音数据类型与原始语音数据中的杂音数据类型相同;确定杂音数据中各分段杂音数据的时长以及所占用的字节数;根据各分段杂音数据的时长以及所占用的字节数确定待参与检测的字节大小。
[0012]根据本申请实施例的另一方面,还提供了一种语音数据的处理装置,包括:第一检测模块,用于确定对原始语音数据进行忙音检测时的检测顺序,以及原始语音数据待参与检测的字节大小,基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测,得到第一语音段数据;第二检测模块,用于对第一语音段数据进行正弦波检测,得到检测结果,确定检测结果中满足预设条件的第一语音段数据为第二语音段数据;确定模块,用于根据第二语音段数据对原始语音数据进行截取,得到有效音频段数据。
[0013]根据本申请实施例的另一方面,还提供了一种非易失性存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行任意一种语音数据的处理方法。
[0014]根据本申请实施例的另一方面,还提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现任意一种语音数据的处理方法。
[0015]在本申请实施例中,采用对原始语音数据进行正弦检测截取有效音频的方式,通过确定对原始语音数据进行忙音检测时的检测顺序,以及原始语音数据待参与检测的字节大小,基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测,得到第一语音段数据;对第一语音段数据进行正弦波检测,得到检测结果,确定检测结果中满足预设条件的第一语音段数据为第二语音段数据;根据第二语音段数据对原始语音数据进行截取,得到有效音频段数据,达到了去除无效音频数据的目的,从而实现了避免无效音频数据对存储空间以及传输宽带的占用,提升了用户听觉体验的技术效果,进而解决了由于相关技术中对录音进行保存时存在无效音频,额外占用存储空间和传输宽带,影响用户听觉体验的技术问题。
附图说明
[0016]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017]图1是根据本申请实施例的一种可选的语音数据的处理方法的流程示意图;
[0018]图2是本申请的语音数据的处理方法应用在在处理电话挂机无效音时的流程示意
图;
[0019]图3是本申请一示例性实施例中的挂机音波形示意图;
[0020]图4是本申请一示例性实施例中的挂机音波形放大示意图;
[0021]图5是本申请一示例性实施例中的静音波形示意图;
[0022]图6是本申请一示例性实例中的带有嘟嘟音的声波示意图;
[0023]图7是本申请一示例性实施例中的经过算法过滤后的声波示意图;
[0024]图8是根据本申请实施例的一种可选的语音数据的处理装置的结构示意图;
[0025]图9示出了可以用来实施本申请的实施例的示例电子设备900的示意性框图。
具体实施方式
[0026]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0027]需要说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音数据的处理方法,其特征在于,包括:确定对原始语音数据进行忙音检测时的检测顺序,以及所述原始语音数据待参与检测的字节大小,基于所述检测顺序以及所述待参与检测的字节大小对所述原始语音数据进行忙音检测,得到第一语音段数据;对所述第一语音段数据进行正弦波检测,得到检测结果,确定所述检测结果中满足预设条件的第一语音段数据为第二语音段数据;根据所述第二语音段数据对所述原始语音数据进行截取,得到有效音频段数据。2.根据权利要求1所述的方法,其特征在于,对所述第一语音段数据进行正弦波检测,得到检测结果,确定所述检测结果中满足预设条件的第一语音段数据为第二语音段数据,包括:获取所述第一语音段数据中各个分段数据对应的各个波形;确定所述各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据;检测所述第三语音段数据对应的正弦波波形的波峰以及波谷;确定所述波峰出现的第一次数以及所述波谷出现的第二次数;确定所述第一次数与第二次数的第一比值,在所述第一比值在第一预设范围之内的情况下,确定所述第三语音段数据为满足预设条件的第二语音段数据。3.根据权利要求1所述的方法,其特征在于,对所述第一语音段数据进行正弦波检测,得到检测结果,确定所述检测结果中满足预设条件的第一语音段数据为第二语音段数据,包括:获取所述第一语音段数据中各个分段数据对应的各个波形;确定所述各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据;检测所述第三语音段数据对应的正弦波波形的波峰以及波谷;获取所述正弦波波形的波峰值与波谷值,确定所述波峰值与波谷值的第二比值,在所述第二比值在第二预设范围之内的情况下,确定所述第三语音段数据为满足预设条件的第二语音段数据。4.根据权利要求1所述的方法,其特征在于,根据所述第二语音段数据对所述原始语音数据进行截取,得到有效音频段数据,包括:确定所述第二语音段数据所占用的目标字节数N;根据所述目标字节数N对所述原始语音数据进行截取确定所述有效音频段数据。5.根据权利要求4所述的方法,其特征在于,根据所述目标字节数对所述原始语音...

【专利技术属性】
技术研发人员:安文政
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1