一种音频处理方法、装置、车辆及计算机可读存储介质制造方法及图纸

技术编号：37678880 阅读：35 留言：0更新日期：2023-05-26 04:45

本申请提供一种音频处理方法、装置、车辆及计算机可读存储介质，所述方法包括：响应于接收到的音频处理请求，获取待处理信息，所述待处理信息为对预设检测区域内的当前发声用户进行检测得到的信息；获取训练好的拒识模型，所述训练好的拒识模型是基于具有多模态特征的训练数据通过训练得到的；利用所述训练好的拒识模型对所述待处理信息进行处理，得到处理结果；基于所述处理结果，对所述待处理信息执行对应的处理操作。通过音频处理装置对用户语音进行识别处理，即使在开启全双工或免唤醒功能的情况下，音频处理装置能够对无效语音和有效语音进行区分，通过对无效语音进行过滤，能够减少无效语音对用户的影响，提高车辆智能化程度。化程度。化程度。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频处理方法、装置、车辆及计算机可读存储介质

[0001]本申请涉及车辆自动化控制
，涉及但不限于一种音频处理方法、装置、车辆及计算机可读存储介质。

技术介绍

[0002]智能座舱(intelligent cabin)旨在集成多种互联网技术(IT，Internet Technology)和人工智能(AI，Artificial Intelligence)技术，打造全新的车内一体化数字平台，为驾驶员提供智能体验，促进行车安全。
[0003]车载语音识别系统是智能座舱不可缺少的一部分，通过车载语音识别系统对用户下发的语音指令进行识别并响应。传统技术中，在用户下发语音指令之前，首先需要使用唤醒词将车载语音识别系统从待机状态唤醒，给用户带来不便。为便于用户，相关技术中车载语音识别系统可以设置免唤醒功能，开启该功能后，用户无需每次唤醒车载语音识别系统，但是带来了新的问题：车载语音识别系统处于持续录音状态，可能会将用户的正常对话当成控制指令进行识别并响应，对用户造成不便，甚至影响行车安全。车载语音识别系统如何在唤醒状态识...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，其特征在于，所述方法包括：响应于接收到的音频处理请求，获取待处理信息，所述待处理信息为对预设检测区域内的当前发声用户进行检测得到的信息；获取训练好的拒识模型，所述训练好的拒识模型是基于具有多模态特征的训练数据通过训练得到的；利用所述训练好的拒识模型对所述待处理信息进行处理，得到处理结果；基于所述处理结果，对所述待处理信息执行对应的处理操作。2.根据权利要求1所述的方法，其特征在于，所述获取训练好的拒识模型，包括：获取预设的初始拒识模型和样本数据集；根据所述样本数据集，获取训练数据集和所述训练数据集包括的各训练数据的标识信息；基于各训练数据和所述各训练数据的标识信息，对所述初始拒识模型进行训练，得到训练好的拒识模型。3.根据权利要求2所述的方法，其特征在于，所述根据所述样本数据集，获取训练数据集和所述训练数据集包括的各训练数据的标识信息，包括：确定所述样本数据集包括的各样本数据的类型，所述样本数据的类型包括音频数据类型和音频图像数据类型；根据所述各样本数据的类型，对所述各样本数据进行特征提取，得到各样本数据对应的训练数据，一个训练数据包括多模态特征；获取各训练数据的标识信息。4.根据权利要求1所述的方法，其特征在于，所述待处理信息包括当前音频特征和当前文本特征；所述响应于接收到的音频处理请求，获取待处理信息，包括：响应于接收到的音频处理请求，确定在预设的检测区域内存在发声用户，控制音频采集装置对所述检测区域内当前发声用户的音频进行采集，得到当前音频数据；对所述当前音频数据进行特征提取，得到当前音频特征和当前文本特征，所述当前音频特征包括频谱、音量、语速和信噪比。5.根据权利要求1所述的方法，其特征在于，所述待处理信息包括当前音频特征、当前文本特征和当前行为特征；所述响应于接收到的音频处理请求，获取待处理信息，包括：响应于接收到的音频处理请求，确定在预设的检测区域内存在发声用户，控制音频采集装置对所述检测区域内当前发声用户的音频进行采集，得到当前音频数据，并控制图像采集装置对所述检测区域内的图像进行采集，得到当前图像数...

【专利技术属性】
技术研发人员：李勉，
申请(专利权)人：阿维塔科技重庆有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人