【技术实现步骤摘要】
语音处理方法及相关装置
本申请涉及语音信号处理领域,具体涉及一种语音处理方法及相关装置。
技术介绍
语音作为一种搭载着特定信息的信号,一直是人们社会生活中获取信息和传播信息的重要的手段,语音信号处理的目的就是在复杂的声学环境中提取有效的语音信息。近年来,基于麦克风阵列的远场拾音系统得到了广泛的应用。但是,系统中非常关键的自动增益控制还是只适用于近场单人讲话的方法,,在远场多人讲话场景下容易引起语音失真。
技术实现思路
本申请实施例提供了一种语音处理方法及相关装置,以期有效处理多说话人场景的语音处理问题。第一方面,本申请实施例提供一种语音处理方法,包括:通过麦克风阵列采集当前空间的用户语音,所述当前空间根据所述麦克风阵列的分布特性划分为多个子空间;确定所述用户语音的说话用户所处的参考子空间,所述参考子空间属于所述多个子空间;查询增益字典,获取所述参考子空间对应的参考增益,所述增益字典包括所述多个子空间中每个子空间和增益之间的对应关系;根据所述参考增益调整所述用户语音。 ...
【技术保护点】
1.一种语音处理方法,其特征在于,包括:/n通过麦克风阵列采集当前空间的用户语音,所述当前空间根据所述麦克风阵列的分布特性划分为多个子空间;/n确定所述用户语音的说话用户所处的参考子空间,所述参考子空间属于所述多个子空间;/n查询增益字典,获取所述参考子空间对应的参考增益,所述增益字典包括所述多个子空间中每个子空间和增益之间的对应关系;/n根据所述参考增益调整所述用户语音。/n
【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:
通过麦克风阵列采集当前空间的用户语音,所述当前空间根据所述麦克风阵列的分布特性划分为多个子空间;
确定所述用户语音的说话用户所处的参考子空间,所述参考子空间属于所述多个子空间;
查询增益字典,获取所述参考子空间对应的参考增益,所述增益字典包括所述多个子空间中每个子空间和增益之间的对应关系;
根据所述参考增益调整所述用户语音。
2.根据权利要求1所述的方法,其特征在于,所述增益字典中的增益包括适配高增益模式的高增益和适配低增益模式的低增益。
3.根据权利要求1所述的方法,其特征在于,所述根据所述参考增益调整所述用户语音,包括:
分析所述用户语音以确定所述说话用户的说话模式;
若所述说话模式为正常音量模式,则根据所述参考增益中适配所述低增益模式的参考低增益调整所述用户语音;
若所述说话模式为低音量模式,则根据所述参考增益中适配所述高增益模式的参考高增益调整所述用户语音。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述增益字典中的增益通过预配置的更新机制进行更新,所述更新机制包括如下操作:
确定当前处理的子空间的增益在高增益模式下的高增益更新步长,以及所述当前处理的子空间的增益在低增益模式下的低增益更新步长;
根据所述高增益更新步长确定高增益增量,根据所述低增益更新步长确定低增益增量;
根据所述高增益增量和所述低增益增量对所述当前处理的子空间的增益进行更新。
5.根据权利要求4所述的方法,其特征在于,所述根据所述高增益增量和所述低增益增量对所述当前处理的子空间的增益进行更新,包括:
若检测到所述高增益增量大于所述低增益增量,则根据所述低增益增量对所述当前处理的子空间的增益中的低增益进行更新,并根据预设步长更新所述当前处理的子空间的增益中的高增益以使得所述高增益向高增益初始值靠近;
若检测到所述高增益增量小于或等于所述低增益增量,则根据所述高增益增量对所述当前处理的子空间的增益中的高增益进行更新,并根据所...
【专利技术属性】
技术研发人员:张健,赵湘,高素云,付中华,王海坤,
申请(专利权)人:西安讯飞超脑信息科技有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。