用于语音设备的人声识别与增强方法、装置及存储介质制造方法及图纸

技术编号:34331368 阅读:57 留言:0更新日期:2022-07-31 02:08
本发明专利技术实施例公开了一种用于语音设备的人声识别与增强方法、装置及存储介质,涉及通信技术领域,能够应用于应急救援中需要在面罩内对对讲机的声音进行扩音和声音增强的场景。本发明专利技术包括:通过NLMS算法对采集的声音信号进行回声消除,其中,在所采集的声音信号中包括了环境噪音和语音信号;对经过步骤1处理的声音进行频谱分析,并提取符合人声特征的声音信号;通过I I R对符合人声特征的声音信号进行增强处理;将经过增强处理的声音信号送给对讲模块。模块。模块。

【技术实现步骤摘要】
用于语音设备的人声识别与增强方法、装置及存储介质


[0001]本专利技术涉及通信
,尤其涉及一种用于语音设备的人声识别与增强方法、装置及存储介质。

技术介绍

[0002]目前,在应急救援的现场协同中广泛使用对讲机作为语音通信手段,而且执行任务中通常需使用肩咪装置,连接对讲机后,无须手持对讲机,挂在肩上即可对讲,也就是在执行紧急任务使用对讲机时需额外配肩咪才方便实时沟通。
[0003]因此救援人员需要配备的通信设备数量较多,使用环境也较为复杂,通话的声音质量和去噪效果较差。另外,由于对讲机的应用场景都较特殊,超长待机和可靠性是最重要的需求,因此此类通信设备一般都采用低功耗、性能较低但相对可靠的系统架构,这类架构的计算能力较低,因此目前很多的声音优化方面的算法功能并不适合在此类架构上实现。并且对于应急救援中需要在面罩内对对讲机的声音进行扩音和声音增强的场景,目前也缺乏较为有效的处理方法。

技术实现思路

[0004]本专利技术的实施例提供一种用于语音设备的人声识别与增强方法、装置及存储介质,以便于应用于应急救援中需要在面本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于语音设备的人声识别与增强方法,其特征在于,在每一周期的处理过程中,包括:步骤1、通过NLMS算法对采集的声音信号进行回声消除;步骤2、对经过步骤1处理的声音进行频谱分析,并提取符合人声特征的声音信号;步骤3、通过IIR对符合人声特征的声音信号进行增强处理;步骤4、将经过增强处理的声音信号送给对讲模块。2.根据权利要求1所述的方法,其特征在于,还包括:播放并记录经过增强处理的声音信号;再利用记录的声音数据,通过NLMS算法对采集的声音信号进行回声消除。3.根据权利要求2所述的方法,其特征在于,在步骤1中包括:将采集的声音信号输入编译码器进行编码;编码后的声音信号存储至语音信号及噪声缓存区,记录的声音数据存储至参考缓存区,其中,处理器从语音信号及噪声缓存区和回声参考缓存区中提取数据。4.根据权利要求3所述的方法,其特征在于,所述语音信号及噪声缓存区中建立m个缓存区,其中,当第n个缓存区正在记录声音信号时,所述处理器同时正在处理第[(n+m

1)mod m]缓存区的数据,同时播放第[(n+m

2)mod m]缓存区的数据,其中,[(n+m

1)mod m]缓存区表示所述第n个缓存区的前一个缓存区,[(n+m

2)mod m]缓存区表示所述第n个缓存区的前两个缓存区。5.根据权利要求1所述的方法,其特征在于,所述通过NLMS算法对采集的声音信号进行回声消除,包括:采集的声音信号经过所述编译码器处理后,以系统输出信号为参考进行NLMS归一化滤波,其中,采集的声音信号经过所述编译码器处理后,输出的数据类型为24位精度有符号整型,所述系统输出信号为上一周期中的经过增强处理的声音信号;再以噪音信号为参考对主信号进行NLMS归一化滤波,得到初步处理后的消噪信号;通过IIR对所述消噪信号进行陷波滤波,其中,IIR工作在被执行在编译时指定频率。6.根据权利要求1所述的方法,其特征在于,所进行的频谱分析,包括:对对经过步骤1处理的声音信号进行CFFT处理,将声音信号从时域信号转为频域信号;在声音信号的人声区中,确定人声区最大能量集中频率,并记录所述人声区最大能量集中频率下的能量强度;获取人声区的幅频特...

【专利技术属性】
技术研发人员:汤凯任崇瀚
申请(专利权)人:南京耀泽电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1