【技术实现步骤摘要】
音频数据处理方法、装置、电子设备及可读存储介质
本申请涉及语音处理
,特别涉及一种音频数据处理方法、装置、电子设备及可读存储介质。
技术介绍
在车载系统中,使用语音控制代替传统的触摸式控制,能够有效提升行车安全性以及便捷性。但在语音控制过程中,当多个人同时说话时,多个说话人的音频数据之间会互相干扰,进而对控制指令的识别造成影响,因而需要对车载系统的麦克风阵列采集到的音频数据进行分离,以便从麦克风阵列采集到的音频数据中,分离出与每个麦克风组件距离最近的人发出的音频数据,进而根据分离出的音频数据识别出相应的控制指令。目前在对音频数据进行分离时,主要是采用波束合成的方法,来对音频数据进行分离,但这种波束合成的方法的准确性较低。
技术实现思路
本申请实施例提供了一种音频数据处理方法、装置、电子设备及可读存储介质,能够提高音频数据分离的准确性。本申请的技术方案如下:一方面,提供了一种音频数据处理方法,该方法包括:对多个音频数据的音频特征进行拼接,得到第一音频特征,该多个音频数据由同一设 ...
【技术保护点】
1.一种音频数据处理方法,其特征在于,所述方法包括:/n对多个音频数据的音频特征进行拼接,得到第一音频特征,所述多个音频数据由同一设备上的多个麦克风组件采集得到;/n对所述第一音频特征进行分类处理,得到分类标签,所述分类标签用于指示所述第一音频特征中的目标音频特征,所述目标音频特征为所述多个麦克风组件中距离声源最近的麦克风组件对应的音频特征;/n基于所述分类标签,从所述第一音频特征中分离出所述目标音频特征;/n基于所述目标音频特征,生成目标音频数据。/n
【技术特征摘要】
1.一种音频数据处理方法,其特征在于,所述方法包括:
对多个音频数据的音频特征进行拼接,得到第一音频特征,所述多个音频数据由同一设备上的多个麦克风组件采集得到;
对所述第一音频特征进行分类处理,得到分类标签,所述分类标签用于指示所述第一音频特征中的目标音频特征,所述目标音频特征为所述多个麦克风组件中距离声源最近的麦克风组件对应的音频特征;
基于所述分类标签,从所述第一音频特征中分离出所述目标音频特征;
基于所述目标音频特征,生成目标音频数据。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一音频特征进行分类处理,得到分类标签包括:
将所述第一音频特征输入音频分类模型,通过所述音频分类模型对所述第一音频特征进行分类处理,得到所述分类标签。
3.根据权利要求2所述的方法,其特征在于,所述音频分类模型的训练过程包括:
获取多个第一样本音频数据对应的多个第一样本音频特征,以及所述多个第一样本音频特征对应的样本分类标签,所述多个第一样本音频数据由同一设备上的多个麦克风组件采集得到,所述样本分类标签用于指示所述多个第一样本音频特征中的目标样本音频特征,所述目标样本音频特征为所述多个麦克风组件中距离声源最近的麦克风组件对应的第一样本音频特征;
基于所述多个第一样本音频特征和所述多个第一样本音频特征对应的样本分类标签,训练所述音频分类模型。
4.根据权利要求1所述的方法,其特征在于,所述对多个音频数据的音频特征进行拼接,得到第一音频特征之前,所述方法还包括:
对所述多个音频数据进行特征提取,得到所述多个音频数据的音频特征。
5.根据权利要求1所述的方法,其特征在于,所述对多个音频数据的音频特征进行拼接,得到第一音频特征包括:
对所述多个音频数据的音频特征进行拼接,得到拼接后的音频特征;
对所述拼接后的音频特征进行压缩,得到所述第一音频特征。
6.根据权利要求1所述的方法,其特征在于,所述...
【专利技术属性】
技术研发人员:陈孝良,冯大航,吴俊,常乐,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。