语音降噪增强方法、装置、产品、车载语音降噪增强系统制造方法及图纸

技术编号：41287480 阅读：7 留言：0更新日期：2024-05-11 09:36

本发明专利技术实施例提供一种语音降噪增强方法、装置、产品、车载语音降噪增强系统。该方法包括：标注初始通道音频数据，获得通道音频数据；对通道音频数据处理，获得增强特征；将原音频标签的增强特征融合降噪，获得原音频特征，将噪声音频标签的增强特征融合降噪，获得噪声音频特征；对原音频特征和噪声音频特征多通道维纳滤波，获得原音频滤波特征和噪声音频滤波特征；根据原音频滤波特征和噪声音频滤波特征，确定目标音频数据。旨在降低语音降噪增强的资源占用和提升降噪增强效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及音频处理，尤其涉及语音降噪增强方法、装置、产品、车载语音降噪增强系统。

技术介绍

1、随着汽车消费升级、个性化需求和智能网联汽车的发展，车载语音系统已经成为人们购买汽车的重要考虑因素之一，车载语音是指在汽车内部使用语音识别交互、蓝牙电话和音视频录制等，提高出行的便捷性、乐趣和舒适度。但是目前降噪增强效果较好的方案为音频与视频唇动融合来对语音进行降噪增强处理，该方式存在以下弊端：车端部署难度高、使用成本高、系统算力资源占用高，处理速度慢。同时现有的降噪增强方式对于低信噪比、非稳态噪声、强混响环境下的语音进行增强时往往难以去除噪声成分，从而导致使用体验不佳。

技术实现思路

1、有鉴于此，本专利技术实施例提供一种语音降噪增强方法、装置、产品、车载语音降噪增强系统，旨在降低对语音进行降噪增强的资源占用的同时提升对语音的降噪增强效果。

2、本专利技术实施例第一方面提供了一种语音降噪增强方法，所述方法包括：

3、对采集的各个初始通道音频数据分别进行标注，获得具有音频标签的各个通道音频数据，所述音频标签包括原音频标签和噪声音频标签；

4、对所述通道音频数据进行处理，获得对应的增强特征；

5、将具有原音频标签的通道音频数据对应的增强特征进行融合降噪处理，获得对应的原音频特征，以及，将具有噪声音频标签的通道音频数据对应的增强特征进行融合降噪，获得对应的噪声音频特征；

6、对所述原音频特征和所述噪声音频特征进行多通道维纳滤

7、根据所述多个原音频滤波特征和所述多个噪声音频滤波特征，确定并输出最终的目标音频数据。

8、可选的，所述对所述通道音频数据进行处理，获得对应的增强特征，包括：

9、对所述通道音频数据进行傅里叶变换，获得对应的目标频域数据；

10、对所述目标频域数据进行增强处理，获得对应的频域特征；

11、对所述频域特征进行池化处理，获得对应的增强特征。

12、可选的，所述将具有原音频标签的通道音频数据对应的增强特征进行融合降噪处理，获得对应的原音频特征，以及，将具有噪声音频标签的通道音频数据对应的增强特征进行融合降噪，获得对应的噪声音频特征，包括：

13、将具有原音频标签的通道音频数据对应的增强特征进行融合，获得对应的原音频融合特征，以及，将具有噪声音频标签的通道音频数据对应的增强特征进行融合，获得对应的噪声音频融合特征；

14、对所述原音频融合特征和所述噪声音频融合特征进行并行降噪处理，获得原音频特征和噪声音频特征。

15、可选的，所述对所述通道音频数据进行傅里叶变换，获得对应的目标频域数据，包括：

16、通过时间窗函数对所述通道音频数据进行划分，获得对应的多个时间窗音频数据；

17、通过分析窗函数对所述多个时间窗音频数据进行并行计算，获得所述多个时间窗音频数据各自对应的中间音频数据；

18、对获得的多个中间音频数据进行并行傅里叶变换，获得所述多个中间音频数据各自对应的子频域数据；

19、将所述多个中间音频数据各自对应的子频域数据共同确定为所述通道音频数据对应的目标频域数据。

20、可选的，所述对所述目标频域数据进行增强处理，获得对应的频域特征，包括：

21、对构成所述目标频域数据的所有子频域数据进行并行增强处理，针对每个子频域数据获得对应的在不同频段的多个子频域特征；

22、将所述所有子音频数据各自对应的在不同频段的多个子频域特征共同确定为所述通道音频数据对应的频域特征。

23、可选的，所述对所述频域特征进行池化处理，获得对应的增强特征，包括：

24、对构成所述频域特征的所有子频域特征进行并行中值池化处理，针对每个子频域特征获得对应的中值特征；

25、将所述所有子频域特征各自对应的中值特征共同确定为所述通道音频数据对应的增强特征。

26、可选的，所述将具有原音频标签的通道音频数据对应的增强特征进行融合，获得对应的原音频融合特征，包括：

27、根据具有原音频标签的通道音频数据的数量，确定进行加权融合的第一权重；

28、根据所述第一权重，将具有原音频标签的相同时间窗口和相同频段下的中值特征进行加权融合，获得对应的原音频融合中值特征；

29、将获得的相同频段下的原音频融合中值特征按照时间先后顺序进行拼接，获得对应的初始原音频融合特征；

30、将不同频段下的初始原音频融合特征共同确定为具有原音频标签的原音频融合特征。

31、可选的，所述将具有噪声音频标签的通道音频数据对应的增强特征进行融合，获得对应的噪声音频融合特征，包括：

32、根据具有噪声音频标签的通道音频数据的数量，确定进行加权融合的第二权重；

33、根据所述第二权重，将具有噪声音频标签的相同时间窗口和相同频段下的中值特征进行加权融合，获得对应的初始噪声音频融合中值特征；

34、将获得的相同频段下的噪声音频融合中值特征按照时间先后顺序进行拼接，获得对应的初始噪声音频融合特征；

35、将不同频段下的初始噪声音频融合特征共同确定为具有噪声音频标签的噪声音频融合特征。

36、可选的，所述对所述原音频融合特征和所述噪声音频融合特征进行并行降噪处理，获得原音频特征和噪声音频特征，包括：

37、对构成所述原音频融合特征的不同频段下的初始原音频融合特征和对构成所述噪声音频融合特征的不同频段下的初始噪声音频融合特征进行并行降噪处理，针对每个频段下的初始原音频融合特征获得对应的初始原音频降噪特征，以及，针对每个频段下的初始噪声音频融合特征获得对应的初始噪声音频降噪特征；

38、将不同频段下的初始原音频降噪特征共同确定为原音频特征，以及，将不同频段下的初始噪声音频降噪特征共同确定为噪声音频特征。

39、可选的，所述对所述原音频特征和所述噪声音频特征进行多通道维纳滤波，获得所述原音频特征对应的多个原音频滤波特征和所述噪声音频特征对应的多个噪声音频滤波特征，包括：

40、将构成所述原音频特征的每种频段下的初始原音频降噪特征输入第一维纳滤波通道进行并行维纳滤波处理，针对每种频段下的初始原音频降噪特征获得对应的多个初始原音频滤波特征，所述第一维纳滤波通道与具有原音频标签的各个通道音频数据的通道一一对应；

41、将构成所述噪声音频特征的每种频段下的初始噪声音频降噪特征输入第二维纳滤波通道进行并行维纳滤波处理，针对每种频段下的初始噪声音频降噪特征获得对应的多个初始噪声音频滤波特征，所述第二维纳滤波通道与具有噪声音频标签的各个通道音频数据的通道一一对应；

42、将经过相同第一维纳滤波通道进行维纳滤波处理所获得的所有初始原音本文档来自技高网...

【技术保护点】

1.一种语音降噪增强方法，其特征在于，所述方法包括：

2.根据权利要求1所述的语音降噪增强方法，其特征在于，所述对所述通道音频数据进行处理，获得对应的增强特征，包括：

3.根据权利要求1所述的语音降噪增强方法，其特征在于，所述将具有原音频标签的通道音频数据对应的增强特征进行融合降噪处理，获得对应的原音频特征，以及，将具有噪声音频标签的通道音频数据对应的增强特征进行融合降噪，获得对应的噪声音频特征，包括：

4.根据权利要求2所述的语音降噪增强方法，其特征在于，所述对所述通道音频数据进行傅里叶变换，获得对应的目标频域数据，包括：

5.根据权利要求4所述的语音降噪增强方法，其特征在于，所述对所述目标频域数据进行增强处理，获得对应的频域特征，包括：

6.根据权利要求5所述的语音降噪增强方法，其特征在于，所述对所述频域特征进行池化处理，获得对应的增强特征，包括：

7.根据权利要求3所述的语音降噪增强方法，其特征在于，所述将具有原音频标签的通道音频数据对应的增强特征进行融合，获得对应的原音频融合特征，包括：

9.根据权利要求8所述的语音降噪增强方法，其特征在于，所述对所述原音频融合特征和所述噪声音频融合特征进行并行降噪处理，获得原音频特征和噪声音频特征，包括：

10.根据权利要求1所述的语音降噪增强方法，其特征在于，所述对所述原音频特征和所述噪声音频特征进行多通道维纳滤波，获得所述原音频特征对应的多个原音频滤波特征和所述噪声音频特征对应的多个噪声音频滤波特征，包括：

11.一种语音降噪增强装置，其特征在于，所述装置包括：

12.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至10任一项所述的一种语音降噪增强方法。

13.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至10任一项所述的一种语音降噪增强方法。

14.一种车载语音降噪增强系统，其特征在于，所述系统包括：单个或多个麦克风阵列、信号处理模块、低通滤波器、模数转换模块，音频数字信号处理器、智能座舱主控器、音频流管理模块；

15.根据权利要求14所述的车载语音降噪增强系统，其特征在于，所述系统还包括云平台、通讯模块；

...

【技术特征摘要】

1.一种语音降噪增强方法，其特征在于，所述方法包括：

2.根据权利要求1所述的语音降噪增强方法，其特征在于，所述对所述通道音频数据进行处理，获得对应的增强特征，包括：

4.根据权利要求2所述的语音降噪增强方法，其特征在于，所述对所述通道音频数据进行傅里叶变换，获得对应的目标频域数据，包括：

5.根据权利要求4所述的语音降噪增强方法，其特征在于，所述对所述目标频域数据进行增强处理，获得对应的频域特征，包括：

6.根据权利要求5所述的语音降噪增强方法，其特征在于，所述对所述频域特征进行池化处理，获得对应的增强特征，包括：

8.根据权利要求7所述的语音降噪增强方法，其特征在于，所述将具有噪声音频标签的通道音频数据对应的增强特征进行融合，获得对应的噪声音频融合特征，包括：...

【专利技术属性】
技术研发人员：李康清，王永亮，贺刚，平涛，王超，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人