一种处理语音数据的方法、装置、设备及可读存储介质制造方法及图纸

技术编号:19483295 阅读:29 留言:0更新日期:2018-11-17 10:57
本发明专利技术公开了一种处理语音数据的方法,包括:获取目标语音文件的频谱图并展示;接收用户在频谱图中选取的目标频率范围,并根据目标频率范围确定对应的目标语音数据;提取目标语音数据,并对目标语音数据进行处理后,播放目标语音数据。该方法可使用户根据目标语音文件的频谱图自主选择特定法人频率范围,且由于用户是根据频谱图选取的语音数据,所以选取的语音数据的质量更佳,也无需对其降噪处理,从而不会影响原来的语音音频的质量,使得播放的语音音频更佳清晰;同时,由于选取的语音数据量较小,也提高了语音数据的处理效率。相应地,本发明专利技术公开的一种处理语音数据的装置、设备及可读存储介质,也同样具有上述技术效果。

【技术实现步骤摘要】
一种处理语音数据的方法、装置、设备及可读存储介质
本专利技术涉及音频处理
,更具体地说,涉及一种处理语音数据的方法、装置、设备及可读存储介质。
技术介绍
随着计算机技术和音频处理技术的不断发展融合,声纹鉴定技术已广泛应用于司法鉴定,为司法鉴定提供了良好的技术保障。目前,对于待鉴定的语音文件的语音频谱图,现有的声纹鉴定系统可以从时间上选取特定区域的语音频谱图。但是由于每个语音信号的频率范围是特定不变的,且现有的系统无法选取特定的频率范围,从而导致需要选取语音数据的所有频率范围,而当语音数据的频率范围覆盖高频区域时,在对其进行降噪处理的过程中,削弱了原有的语音音频的质量,从而导致语音音频的播放不清晰,影响声纹鉴定结果;同时,由于选取的语音数据量较大,也降低了语音数据的处理效率。因此,如何提高语音数据的处理效率,为声纹鉴定提高可靠的技术支持,是本领域技术人员需要解决的问题。
技术实现思路
本专利技术的目的在于提供一种处理语音数据的方法、装置、设备及可读存储介质,以提高语音数据的处理效率,为声纹鉴定提高可靠的技术支持。为实现上述目的,本专利技术实施例提供了如下技术方案:一种处理语音数据的方法,包括:获取目标语音文件的频谱图并展示;接收用户在所述频谱图中选取的目标频率范围,并根据所述目标频率范围确定对应的目标语音数据;提取所述目标语音数据,并对所述目标语音数据进行处理后,播放所述目标语音数据。其中,所述获取目标语音文件的频谱图并展示之前,还包括:获取所述目标语音文件,并生成所述目标语音文件的频谱图。其中,所述提取所述目标语音数据,并对所述目标语音数据进行处理后,播放所述目标语音数据,包括:提取所述目标语音数据,并对所述目标语音数据进行频域转换;对频域转换后的目标语音数据进行时域转换,并播放所述目标语音数据。其中,所述提取所述目标语音数据,并对所述目标语音数据进行频域转换,包括:将所述频谱图中除所述目标频率范围的其他频率置零,以提取所述目标语音数据,并对所述目标语音数据进行频域转换。一种处理语音数据的装置,包括:获取模块,用于获取目标语音文件的频谱图并展示;确定模块,用于接收用户在所述频谱图中选取的目标频率范围,并根据所述目标频率范围确定对应的目标语音数据;执行模块,用于提取所述目标语音数据,并对所述目标语音数据进行处理后,播放所述目标语音数据。其中,还包括:生成模块,用于获取所述目标语音文件,并生成所述目标语音文件的频谱图。其中,所述执行模块包括:频域转换单元,用于提取所述目标语音数据,并对所述目标语音数据进行频域转换;时域转换单元,用于对频域转换后的目标语音数据进行时域转换,并播放所述目标语音数据。其中,所述频域转换单元具体用于:将所述频谱图中除所述目标频率范围的其他频率置零,以提取所述目标语音数据,并对所述目标语音数据进行频域转换。一种处理语音数据的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述任意一项所述的处理语音数据的方法的步骤。一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述的处理语音数据的方法的步骤。通过以上方案可知,本专利技术实施例提供的一种处理语音数据的方法,包括:获取目标语音文件的频谱图并展示;接收用户在所述频谱图中选取的目标频率范围,并根据所述目标频率范围确定对应的目标语音数据;提取所述目标语音数据,并对所述目标语音数据进行处理后,播放所述目标语音数据。可见,所述方法可使用户根据目标语音文件的频谱图自主选择特定法人频率范围,且由于用户是根据频谱图选取的语音数据,所以选取的语音数据的质量更佳,也无需对其进行降噪处理,故不会影响原来的语音音频的质量,使得播放的语音音频更佳清晰;同时,由于选取的语音数据量较小,也提高语音数据的处理效率。相应地,本专利技术实施例提供的一种处理语音数据的装置、设备及可读存储介质,也同样具有上述技术效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种处理语音数据的方法流程图;图2为本专利技术实施例公开的另一种处理语音数据的方法流程图;图3为本专利技术实施例公开的一种处理语音数据的装置示意图;图4为本专利技术实施例公开的一种处理语音数据的设备示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种处理语音数据的方法、装置、设备及可读存储介质,以提高语音数据的处理效率,为声纹鉴定提高可靠的技术支持。参见图1,本专利技术实施例提供的一种处理语音数据的方法,包括:S101、获取目标语音文件的频谱图并展示;目前,声纹鉴定专家在进行声纹鉴定时,一般通过语音频谱图来判别待鉴定的语音音节和已有的模板语音音节的不同。当待鉴定的语音频谱图和模板语音频谱图极为相似时,用户可自由选取待鉴语音和模板语音的同一语音音节的频谱图进行比较。故获取目标语音文件的频谱图并进行展示,可使用户根据频谱图自由选取想要试听的部分语音。S102、接收用户在频谱图中选取的目标频率范围,并根据目标频率范围确定对应的目标语音数据;具体的,在现有的声纹鉴定系统中,仅支持用户选取相似语音音节的频谱图,当用户选取的语音音节的频率范围比较广泛,且覆盖高频区域时,对高频区域进行降噪等处理后,会使得用户选取的语音音节播放不清晰,从而影响声纹鉴定结果。在本实施例中,用户可自由选取想要试听的语音音节的频率范围。例如:当某一音节的频率覆盖范围为3KHZ-8KHZ时,用户可选取频率范围为3KHZ-5KHZ的语音进行试听。具体的,当用户选取目标频率范围后,声纹鉴定系统则可根据用户选取的频率范围确定想要试听的语音数据,并对其进行后续处理。S103、提取目标语音数据,并对目标语音数据进行处理后,播放目标语音数据。具体的,当用户选取的语音数据的频率范围未覆盖较高频率时,无需对语音数据进行降噪处理,从而不会影响原来语音音节的质量,进而可使语音播放的更为清晰。可见,本实施例提供的一种处理语音数据的方法,所述方法可使用户根据目标语音文件的频谱图自主选择特定法人频率范围,且由于用户是根据频谱图选取的语音数据,所以选取的语音数据的质量更佳,也无需对其降噪处理,从而不会影响原来的语音音频的质量,使得播放的语音音频更佳清晰;同时,由于选取的语音数据量较小,也提高语音数据的处理效率。本专利技术实施例公开了另一种处理语音数据的方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。参见图2,本专利技术实施例提供的另一种处理语音数据的方法,包括:S201、获取目标语音文件,并生成目标语音文件的频谱图;具体的,当获取到一份语音文件时,首先需要根据获得的语音文件生成对应的频谱图。例如:当获取到嫌疑人的录音文件时,可将本文档来自技高网...

【技术保护点】
1.一种处理语音数据的方法,其特征在于,包括:获取目标语音文件的频谱图并展示;接收用户在所述频谱图中选取的目标频率范围,并根据所述目标频率范围确定对应的目标语音数据;提取所述目标语音数据,并对所述目标语音数据进行处理后,播放所述目标语音数据。

【技术特征摘要】
1.一种处理语音数据的方法,其特征在于,包括:获取目标语音文件的频谱图并展示;接收用户在所述频谱图中选取的目标频率范围,并根据所述目标频率范围确定对应的目标语音数据;提取所述目标语音数据,并对所述目标语音数据进行处理后,播放所述目标语音数据。2.根据权利要求1所述的处理语音数据的方法,其特征在于,所述获取目标语音文件的频谱图并展示之前,还包括:获取所述目标语音文件,并生成所述目标语音文件的频谱图。3.根据权利要求1所述的处理语音数据的方法,其特征在于,所述提取所述目标语音数据,并对所述目标语音数据进行处理后,播放所述目标语音数据,包括:提取所述目标语音数据,并对所述目标语音数据进行频域转换;对频域转换后的目标语音数据进行时域转换,并播放所述目标语音数据。4.根据权利要求3所述的处理语音数据的方法,其特征在于,所述提取所述目标语音数据,并对所述目标语音数据进行频域转换,包括:将所述频谱图中除所述目标频率范围的其他频率置零,以提取所述目标语音数据,并对所述目标语音数据进行频域转换。5.一种处理语音数据的装置,其特征在于,包括:获取模块,用于获取目标语音文件的频谱图并展示;确定模块,用于接收用户在所述频谱图中选取的...

【专利技术属性】
技术研发人员:冯来见张锦华
申请(专利权)人:广州国音科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1