【技术实现步骤摘要】
一种语音处理方法、装置和存储介质
本申请涉及通信领域,特别是涉及一种语音处理方法、装置和存储介质。
技术介绍
随着移动通信技术的快速发展,语音识别技术在各个行业的得到了快速的推广,比如,在银行或者金融机构等行业中,语音识别技术能够实现后台客服的质检,还可以将采集的客服语音转换为文字,从中提取客户信息,针对客户信息定制对应的服务等。在语音识别技术过程中,在获取目标语音数据时通常会夹杂着实际应用场景中的环境噪声,环境噪声一般包括平稳噪声(比如白噪声)和非平稳噪声(周围人的说话声,窗外的汽车鸣笛声),所以首先会对获取的语音数据进行降噪调整处理,使得处理后的目标语音数据与语音识别库里的数据尽可能一致。在目前的语音识别技术中,对于非平稳噪声的抑制效果很有限,对平稳噪声的去除效果较为明显,但是容易出现语音失真,噪声残留不自然,从而导致语音识别的质量不高。针对上述的现有技术中存在的语音识别的质量不高的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本公开的实施例提供了一种语音处理方法、装置和存储介 ...
【技术保护点】
1.一种语音处理方法,应用于语音处理系统,其特征在于,包括:/n获取第一语音数据,所述第一语音数据包括目标语音数据和背景噪声数据;/n在所述第一语音数据中确定只包含背景噪声的噪声音频片段,并从所述第一语音数据中去除所述噪声音频片段,生成第二语音数据;以及/n对所述第二语音数据进行用于抑制背景噪声数据的噪声抑制处理,生成第三语音数据。/n
【技术特征摘要】
1.一种语音处理方法,应用于语音处理系统,其特征在于,包括:
获取第一语音数据,所述第一语音数据包括目标语音数据和背景噪声数据;
在所述第一语音数据中确定只包含背景噪声的噪声音频片段,并从所述第一语音数据中去除所述噪声音频片段,生成第二语音数据;以及
对所述第二语音数据进行用于抑制背景噪声数据的噪声抑制处理,生成第三语音数据。
2.根据权利要求1所述的方法,其特征在于,在所述第一语音数据中确定只包含背景噪声的噪声音频片段,包括:
将所述第一语音数据按照预设时间周期分割成多个音频片段;以及
根据预设语音参数的阈值,在多个所述音频片段中确定所述噪声音频片段。
3.根据权利要求2所述的方法,其特征在于,所述预设语音参数包括平均能量、预设频率能量和频谱平坦度,其中预设频率能量为当所述第一语音数据的频率小于预设值时对应的能量。
4.根据权利要求2和3中所述的方法,其特征在于,根据预设语音参数的阈值,在多个所述音频片段中确定所述噪声音频片段,包括:
分别获取每个所述音频片段中的平均能量、预设频率能量和频谱平坦度;
将所述音频片段中的所述平均能量小于第一阈值、所述预设频率能量小于第二阈值且所述频谱平坦度大于第三阈值对应的所述音频片段确定为噪声音频片段。
5.根据权利要求1所述的方法,其特征在于,对所述第二语音数据进行用于抑制背景噪声数据的噪声抑制处理,包括:
将所述第二语音数据的特征值调整至预设范围内,使得能够相对于所述背景噪声数据识别所述目标语音数据。
6.根据权利要求5所述的方法,其特征在...
【专利技术属性】
技术研发人员:高星,赵立军,
申请(专利权)人:北京中关村科金技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。