一种基于增强学习的音频处理方法、系统及数字扬声器技术方案

技术编号：46622948 阅读：1 留言：0更新日期：2025-10-14 21:18

本申请提供一种基于增强学习的音频处理方法、系统及数字扬声器，涉及音频处理技术领域，采集数字扬声器接收到的音频信号；将音频信号转换为音频频域校正信号，对音频频域校正信号进行失真抑制，得到音频失真权衡信号，进而提取音频失真权衡信号中的能量动态趋势向量；获取预先训练的基于增强学习的音频内容分类模型，依据能量动态趋势向量和基于增强学习的音频内容分类模型对音频信号进行内容分类，进而得到数字扬声器接收到的音频信号的音频内容类型；根据音频内容类型对数字扬声器接收到的音频信号进行动态音效增强。本申请可以充分利用音频内容识别结果动态驱动增强策略的切换与调整，以提高数字扬声器对输入音频的音效调节响应能力。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及音频处理，更具体地说，本申请涉及一种基于增强学习的音频处理方法、系统及数字扬声器。

技术介绍

1、近年来，人工智能技术在语音识别、图像处理等领域取得突破性进展，部分研究开始将增强学习(reinforcement learning,rl)机制引入音频处理，以实现系统自适应调整和用户行为反馈驱动优化，基于增强学习的音频处理是一种将智能学习机制引入音频信号分析与增强的前沿方法。随着消费级音频设备特别是数字扬声器的广泛应用，用户对音质体验的要求日益提升，现代数字扬声器系统通常具备高采样率、低失真输出能力，并集成了多种数字信号处理模块(如均衡器、动态压缩器、降噪处理器等)，用于提升音频播放的清晰度、层次感与空间感。

2、然而，现有技术中，通常依赖静态或手动配置参数，缺乏对音频内容类型及播放环境的感知能力，导致在多样化使用场景下表现不佳。例如，在语音通话场景中，增强低频或过度混响可能反而削弱语义清晰度；而在音乐播放场景中，若未能根据节奏与频谱特征动态调整音效，可能影响沉浸体验。并且当前系统往往将内容分类和音效处理分别独立实现，...

【技术保护点】

1.一种基于增强学习的音频处理方法，其特征在于，所述音频处理方法包括如下步骤：

2.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，使用数字信号监听器采集数字扬声器接收到的音频信号。

3.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，将所述音频信号转换为音频频域校正信号具体包括：

4.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，对所述音频频域校正信号进行失真抑制，得到音频失真权衡信号具体包括：

5.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，提取所述音频失真权衡信号中的能量动...

【技术特征摘要】

1.一种基于增强学习的音频处理方法，其特征在于，所述音频处理方法包括如下步骤：

2.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，使用数字信号监听器采集数字扬声器接收到的音频信号。

3.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，将所述音频信号转换为音频频域校正信号具体包括：

4.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，对所述音频频域校正信号进行失真抑制，得到音频失真权衡信号具体包括：

5.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，提取所述音频失真权衡信号中的能量动态趋势向量具体包括：

6.如权利要求1所述的一种基于增强学习的音频处理方法，其特征在于，基于增强学...

【专利技术属性】
技术研发人员：邓文峻，
申请(专利权)人：广东天宏声光电科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人