语音数据采集方法、终端及可读存储介质技术

技术编号：23707331 阅读：43 留言：0更新日期：2020-04-08 11:38

本发明专利技术公开了一种语音数据采集方法，通过获取带噪语音信号，估计所述带噪语音信号中语音信号的语音占比估计值，判断所述语音占比估计值是否小于预设语音占比值，若所述语音占比估计值小于预设语音占比值，则对所述带噪语音信号进行降噪处理，得到降噪语音信号。本发明专利技术还公开了一种终端、可读存储介质。实现了在提高语音数据采集质量的同时保证了语音信号真实性的目的。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据采集方法、终端及可读存储介质
本专利技术涉及语音信号处理领域，尤其涉及一种语音数据采集方法、终端及可读存储介质。
技术介绍
随着声纹识别技术的发展，公安机关在侦查破案过程中对声纹识别技术的使用日益频繁，但是，通常情况下公安部声纹库保留的都是原始语音数据，而这些原始语音数据在采集时又无法保证周围的环境，导致这些原始语音数据中带有噪音，而声纹识别技术需要从原始语音数据中提取声纹特征，必须保证用于提取声纹特征的语音数据质量，也就是采集到的原始语音数据在提取声纹特征前，需要进行去噪处理，但是，去噪处理又必然会导致原始语音信号失真的问题。上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种语音数据采集方法、终端及可读存储介质，旨在解决语音数据采集质量低、语音信号真实性低的问题。为实现上述目的，本专利技术提供一种语音数据采集方法，所述语音数据采集方法包括：获取带噪语音信号；估计所述带噪语音信号中语音信号的语音占比估计值；判断所述语音占比估计值是否小于预设语音占比值；若所述语音占比估计值小于预设语音占比值，则对所述带噪语音信号进行降噪处理，得到降噪语音信号。可选地，所述估计所述带噪语音信号中语音信号的语音占比估计值的步骤之前包括：将所述带噪语音信号进行分帧和加窗处理，得到带噪语音帧信号；将各所述带噪语音帧信号分别按时序进行离散傅里叶变换，得到离散幅度谱组。>可选地，所述语音占比估计值为后验信噪比，所述估计所述带噪语音信号中语音信号的语音占比估计值的步骤包括：基于所述离散幅度谱组，通过最小统计方法，获取最小幅度谱；基于所述最小幅度谱，获取噪音功率谱估计值；基于所述最小幅度谱和所述噪音功率谱估计值，得到后验信噪比。可选地，所述对所述带噪语音信号进行降噪处理的步骤之前包括：获取所述噪音功率谱前一帧同频率的语音幅度谱，基于所述语音幅度谱，得到语音功率谱估计值；基于所述语音功率谱估计值、所述噪音功率谱估计值和所述后验信噪比，得到先验信噪比。可选地，所述基于所述语音功率谱估计值、所述噪音功率谱估计值和所述后验信噪比，得到先验信噪比的步骤包括：基于所述语音功率谱估计值和所述噪音功率谱估计值，得到第一先验信噪比；根据所述后验信噪比和所述第一先验信噪比，基于MMSE(MinimumMeanSquaredError，最小均方误差)，得到第二先验信噪比，其中，所述第一先验信噪比为所述第二先验信噪比前一帧同频率语音的先验信噪比。可选地，所述对所述带噪语音信号进行降噪处理的步骤包括：基于所述第二先验信噪比，得到降噪衰减增益；基于所述降噪衰减增益和所述带噪语音帧信号，得到降噪语音帧信号；将所述降噪语音帧信号进行去窗和重叠相加处理，得到降噪语音信号。可选地，所述获取带噪语音信号步骤之前包括：获取反向接入电路的麦克风的负原始语音信号；获取正向接入电路的麦克风的正原始语音信号；将所述负原始语音信号与所述正原始语音信号进行相互叠加以初步去除噪音，得到带噪语音信号。可选地，所述判断所述语音占比估计值是否小于预设语音占比值的步骤之后还包括：若所述后验信噪比大于或等于所述预设值，则不对所述带噪语音信号进行降噪处理。为实现上述目的，本专利技术还提供一种终端，所述终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音数据采集程序，所述语音数据采集程序被所述处理器执行时实现上述的语音数据采集方法的步骤。此外，为实现上述目的，本专利技术还提供一种计算机存储介质，计算机存储介质上存储有语音数据采集程序，语音数据采集程序被处理器执行时实现上述的语音数据采集方法的步骤。本专利技术实施例提出的一种语音数据采集方法、终端及可读存储介质，通过获取带噪语音信号，估计所述带噪语音信号中语音信号的语音占比估计值，判断所述语音占比估计值是否小于预设语音占比值，若所述语音占比估计值小于预设语音占比值，则对所述带噪语音信号进行降噪处理，得到降噪语音信号，采集语音数据时，设置两个麦克风，一个正向接入电路，一个反向接入电路，以做到初步降噪，并且在语音中含有的语音程度过低时对带噪语音信号进行降噪处理，保证了语音数据的质量，另外，在语音中含有的语音程度较高时，不对带噪语音信号进行降噪处理，又保证了语音数据的真实性，因此，根据带噪语音信号中含有语音信号程度的高低，来决定带噪语音信号是否需要进行降噪处理。实现了在提高语音数据采集质量的同时保证了语音信号真实性的目的。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图；图2为本专利技术语音数据采集方法第一实施例的流程示意图；图3为本专利技术语音数据采集方法第二实施例的流程示意图；图4为本专利技术语音数据采集方法第三实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。具体实施方式应当理解，此处所描述的具体实施例仅仅用以解释本专利技术，并不用于限定本专利技术。本专利技术实施例的主要解决方案是：本专利技术实施例提出的一种语音数据采集方法、终端及可读存储介质通过获取带噪语音信号，估计所述带噪语音信号中语音信号的语音占比估计值，判断所述语音占比估计值是否小于预设语音占比值，若所述语音占比估计值小于预设语音占比值，则对所述带噪语音信号进行降噪处理，实现了在提高语音数据采集质量的同时保证了语音信号真实性的目的。由于现有技术在处理采集到的语音数据时，对所有的语音信号都进行降噪处理，而没有区分哪些是不需要进行降噪处理的，这样做会导致语音信号失真严重的问题。本专利技术提供一种解决方案，使得在提高语音数据采集质量的同时保证了语音信号真实性。如图1所示，图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图。本专利技术实施例终端可以是PC，也可以是智能手机、平板电脑、电子书阅读器、MP3(MovingPictureExpertsGroupAudioLayerIII，动态影像专家压缩标准音频层面3)播放器、MP4(MovingPictureExpertsGroupAudioLayerIV，动态影像专家压缩标准音频层面3)播放器、便携计算机等具有显示功能的可移动式终端设备。如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile本文档来自技高网...

【技术保护点】
1.一种语音数据采集方法，其特征在于，包括：/n获取带噪语音信号；/n估计所述带噪语音信号中语音信号的语音占比估计值；/n判断所述语音占比估计值是否小于预设语音占比值；/n若所述语音占比估计值小于预设语音占比值，则对所述带噪语音信号进行降噪处理，得到降噪语音信号。/n

【技术特征摘要】
1.一种语音数据采集方法，其特征在于，包括：
获取带噪语音信号；
估计所述带噪语音信号中语音信号的语音占比估计值；
判断所述语音占比估计值是否小于预设语音占比值；
若所述语音占比估计值小于预设语音占比值，则对所述带噪语音信号进行降噪处理，得到降噪语音信号。

2.如权利要求1所述的语音数据采集方法，其特征在于，所述估计所述带噪语音信号中语音信号的语音占比估计值的步骤之前包括：
将所述带噪语音信号进行分帧和加窗处理，得到带噪语音帧信号；
将各所述带噪语音帧信号分别按时序进行离散傅里叶变换，得到离散幅度谱组。

3.如权利要求2所述的语音数据采集方法，其特征在于，所述语音占比估计值为后验信噪比，所述估计所述带噪语音信号中语音信号的语音占比估计值的步骤包括：
基于所述离散幅度谱组，通过最小统计方法，获取最小幅度谱；
基于所述最小幅度谱，获取噪音功率谱估计值；
基于所述最小幅度谱和所述噪音功率谱估计值，得到后验信噪比。

4.如权利要求3所述的语音数据采集方法，其特征在于，所述对所述带噪语音信号进行降噪处理的步骤之前包括：
获取所述噪音功率谱前一帧同频率的语音幅度谱，基于所述语音幅度谱，得到语音功率谱估计值；
基于所述语音功率谱估计值、所述噪音功率谱估计值和所述后验信噪比，得到先验信噪比。

5.如权利要求4所述的语音数据采集方法，其特征在于，所述基于所述语音功率谱估计值、所述噪音功率谱估计值和所述后验信噪比，得到先验信噪比的步骤包括：
基于所述语音功率谱估计值和所述噪音功率...

【专利技术属性】
技术研发人员：黄族良，龙洪锋，
申请(专利权)人：广州国音智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人