音频处理方法、装置、设备、存储介质及车辆制造方法及图纸

技术编号：42470529 阅读：21 留言：0更新日期：2024-08-21 12:55

本公开涉及一种音频处理方法、装置、设备、存储介质及车辆，该音频处理方法包括：获取图像采集装置采集的图像信息，并从图像信息中获取目标用户的人脸特征；根据目标用户的人脸特征，从预先建立的至少一个对应关系中进行查询，确定目标用户的声纹特征；将目标用户的声纹特征、目标用户的人脸特征、以及音频采集装置实时采集到的原始音频信号进行特征融合处理，并对融合后的音频信号进行降噪处理，得到目标用户的目标音频信号。根据本公开实施例，能够通过结合声纹特征、人脸特征和音频信号的多模态信息，对目标用户的原始音频信号进行降噪处理，实现了用户个性化降噪体验，同时提高了降噪处理效果。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机，尤其涉及一种音频处理方法、装置、设备、存储介质及车辆。

技术介绍

1、随着通信技术的不断发展，用户可以通过各种不同的通话设备(例如，手机、车载设备等)与其他用户进行通话。

2、在一些场景中，用户在进行通话时其周围可能比较吵杂，因此，需要对通话设备采集到的音频信号进行降噪。但是，现有技术的降噪效果不佳，导致通话质量较低，用户体验较低。

技术实现思路

1、为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种音频处理方法、装置、设备、存储介质及车辆。

2、本公开实施例的第一方面提供了一种音频处理方法，该方法包括：

3、获取图像采集装置采集的图像信息，并从图像信息中获取目标用户的人脸特征；

4、根据目标用户的人脸特征，从预先建立的至少一个对应关系中进行查询，确定目标用户的声纹特征；

5、将目标用户的声纹特征、目标用户的人脸特征、以及音频采集装置实时采集到的原始音频信号进行特征融合处理，并对融合后的音频信号...

【技术保护点】

1.一种音频处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，从所述图像信息中获取目标用户的人脸特征，包括：

3.根据权利要求1所述的方法，其特征在于，根据所述目标用户的人脸特征，从预先建立的至少一个对应关系中进行查询，确定所述目标用户的声纹特征，包括：

4.根据权利要求3所述的方法，其特征在于，所述至少一个对应关系中的每个对应关系包括已注册用户的人脸特征、声纹特征、用户标识；

5.根据权利要求1所述的方法，其特征在于，将所述目标用户的声纹特征、所述目标用户的人脸特征、以及音频采集装置实时采集到的原始音频信号进...

【技术特征摘要】

1.一种音频处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，从所述图像信息中获取目标用户的人脸特征，包括：

4.根据权利要求3所述的方法，其特征在于，所述至少一个对应关系中的每个对应关系包括已注册用户的人脸特征、声纹特征、用户标识；

5.根据权利要求1所述的方法，其特征在于，将所述目标用户的声纹特征、所述目标用户的人脸特征、以及音频采集装置实时采集到的原始音频信号进行特征融合处理之前，所述...

【专利技术属性】
技术研发人员：李劲东，
申请(专利权)人：北京罗克维尔斯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人