【技术实现步骤摘要】
语音噪声过滤方法、装置、电子设备和介质
[0001]本公开涉及语音识别
,尤其涉及一种语音噪声过滤方法、装置、电子设备和存储介质。
技术介绍
[0002]随着语音识别技术的发展,语音识别的应用也越来越广泛,但是由于实网环境的复杂性,待识别的语音中包括各种复杂环境噪声,例如彩铃、笑声、咳嗽声、背景人声、信道噪声等。
[0003]相关技术中,采用语音端点检测(Voice Activity Detection,VAD)技术以分离有效的语音信号和无用的语音信号或者噪音信号,但是该方案去除噪声的效果不够好,导致仍会影响语音识别系统的性能,进而噪声用户的体验度较差。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0005]本公开的目的在于提供一种语音噪声过滤方法、装置、存储介质及电子设备,至少在一定程度上克服由于相关技术中对噪声过滤的效果不佳的问题。
[0006]本公开的其他 ...
【技术保护点】
【技术特征摘要】
1.一种语音噪声过滤方法,其特征在于,包括:对输入的语音信息进行分段操作,得到分段语音;基于所述分段语音中的人声特征执行层次聚类操作,得到初始聚类簇;基于K均值聚类对所述初始聚类簇进行修正,并确定修正后的聚类中心;根据所述分段语音与所述聚类中心之间的距离和距离分布,识别所述分段语音中的噪声;对识别出的所述噪声执行噪声过滤操作,得到过滤后的所述语音信息。2.根据权利要求1所述的语音噪声过滤方法,其特征在于,所述基于所述分段语音中的人声特征执行层次聚类操作,得到初始聚类簇,具体包括:基于滤波器组提取所述分段语音中的语音特征;将所述语音特征输入延时神经网络,以得到由所述延时神经网络生成的输出特征;计算所述输出特征的平均特征向量,将所述平均特征向量作为所述人声特征,以对所述人声特征执行所述层次聚类操作,得到所述初始聚类簇。3.根据权利要求2所述的语音噪声过滤方法,其特征在于,所述对所述人声特征执行所述层次聚类操作,得到所述初始聚类簇,具体包括:在所述分段语音中选择分段时长大于第一时长阈值的聚类分段语音,将所述聚类分段语音中的所述人声特征确定为聚类特征;对所述聚类特征执行自底向上的合并层次聚类操作,生成所述初始聚类簇。4.根据权利要求3所述的语音噪声过滤方法,其特征在于,所述基于K均值聚类对所述初始聚类簇进行修正,并确定修正后的聚类中心,具体包括:基于余弦相似度计算任意两个所述聚类特征之间的距离;基于所述距离修正所述初始聚类簇,得到修正聚类簇;在每个修正聚类簇中,在所述聚类分段语音中选择分段时长大于第二时长阈值的中心分段语音;计算属于所述中心分段语音的所述平均特征向量的均值,得到中心特征向量,基于所述中心特征向量确定所述聚类中心。5.根据权利要求4所述的语音噪声过滤方法,其特征在于,还包括:在检测到所述聚类分段语音的分段时长均小于或等于所述第二时长阈值,停止执行噪声过滤操作。6.根据权利要求1所述的语音噪声过滤方法,其特征在于,所述根据所述分...
【专利技术属性】
技术研发人员:张后力,袁改娟,龚健,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。