【技术实现步骤摘要】
一种语音数据处理方法及装置
本专利技术涉及拾音
,尤其涉及一种语音数据处理方法及装置。
技术介绍
在语音处理领域,智能设备(如智能音箱、智能电视等)的不断普及,对语音处理领域中的麦克风阵列技术提出了更高的要求。在目前的会议系统中,为了记录会议中所有发言人的语音数据,可以通过全向拾音设备采集各个方向上说话人的语音数据,并对采集到的全方向上的语音数据进行语音处理。可见,在语音数据处理过程中,采集全方向上的语音数据容易造成较大的噪声干扰,比如在会议发言人说话的过程中存在其余人的说话声音,导致拾音设备采集到了除发言人对应的语音数据之外的其余语音数据(即噪声),进而导致语音识别的准确率低下。
技术实现思路
本专利技术实施例提供一种语音数据处理方法和装置,可以降低语音数据采集过程中的噪声干扰,进而提高语音识别的准确率。本专利技术一方面提供了一种语音数据处理方法,包括:响应针对麦克风阵列的第一触发操作;所述麦克风阵列包括多个分别指向对应方向的第一麦克风集合,每个第一麦克风集合均与第一语音拾取模式相关联;激活与所述第一触发操作相关联的至少一个第一麦克风集合,将激活的第一麦克风集 ...
【技术保护点】
1.一种语音数据处理方法,其特征在于,包括:响应针对麦克风阵列的第一触发操作;所述麦克风阵列包括多个分别指向对应方向的第一麦克风集合,每个第一麦克风集合均与第一语音拾取模式相关联;激活与所述第一触发操作相关联的至少一个第一麦克风集合,将激活的第一麦克风集合确定为工作麦克风集合,根据所述工作麦克风集合所指向的方向确定目标方向范围;通过所述第一语音拾取模式和所述工作麦克风集合,对所述目标方向范围内的语音信号进行语音拾取,生成第一目标语音信号。
【技术特征摘要】
1.一种语音数据处理方法,其特征在于,包括:响应针对麦克风阵列的第一触发操作;所述麦克风阵列包括多个分别指向对应方向的第一麦克风集合,每个第一麦克风集合均与第一语音拾取模式相关联;激活与所述第一触发操作相关联的至少一个第一麦克风集合,将激活的第一麦克风集合确定为工作麦克风集合,根据所述工作麦克风集合所指向的方向确定目标方向范围;通过所述第一语音拾取模式和所述工作麦克风集合,对所述目标方向范围内的语音信号进行语音拾取,生成第一目标语音信号。2.根据权利要求1所述的方法,其特征在于,所述激活与所述第一触发操作相关联的至少一个第一麦克风集合,将激活的第一麦克风集合确定为工作麦克风集合,根据所述工作麦克风集合所指向的方向确定目标方向范围,包括:当所述第一触发操作关联至少两个第一麦克风集合时,激活所述至少两个第一麦克风集合,将激活的第一麦克风集合确定为工作麦克风集合;获取每个工作麦克风集合分别指向的方向的第一角度信息;若每相邻两个工作麦克风集合之间的夹角小于或等于角度阈值,则将所述第一角度信息中最小的角度信息与最大的角度信息之间的角度范围确定为目标方向范围。3.根据权利要求2所述的方法,其特征在于,所述通过所述第一语音拾取模式和所述工作麦克风集合,对所述目标方向范围内的语音信号进行语音拾取,生成第一目标语音信号,包括:通过所述第一语音拾取模式和所述至少两个第一麦克风集合,生成每个第一麦克风集合分别对应的语音增益信号;所述语音增益信号为所述每个第一麦克风集合基于所述目标方向范围内的语音信号生成的;根据所述每个第一麦克风集合分别对应的加权系数、所述每个第一麦克风集合分别对应的语音增益信号,生成所述第一目标语音信号。4.根据权利要求1所述的方法,其特征在于,所述通过所述第一语音拾取模式和所述工作麦克风集合,对所述目标方向范围内的语音信号进行语音拾取,生成第一目标语音信号,包括:获取针对所述工作麦克风集合对应的传递函数向量与滤波器矩阵;获取语音信号,并确定所述工作麦克风集合所指向的方向与所述语音信号对应的声源定位方向之间的第二角度信息;根据所述传递函数向量、所述滤波器矩阵以及所述第二角度信息,确定所述第一语音拾取模式下所述工作麦克风集合对应的增益向量;基于所述增益向量对所述语音信号进行卷积,生成第一目标语音信号;若所述第二角度信息属于增益角度范围,则所述第一目标语音信号为语音增强后的语音信号;若所述第二角度信息不属于增益角度范围,则所述第一目标语音信号为语音抑制后的语音信号。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取语音信号,根据所述麦克风阵列中至少两个麦克风获取到所述语音信号的时间差,确定所述语音信号对应的声源定位方向。6.根据权利要求1所述的方法,其特征在于,所述麦克风阵列还包括第二麦克风集合;所述第二麦克风集合与第二语音拾取模式相关联,所述第二语音拾取模式用于对语音信号进行超指向增强,所述第二语音拾取模式的声音采集距离大于所述第一语音拾取模式的声音采集距离;当从工作麦克风集合切换至第二麦克风集合时,所述第二麦克风集合用于基于第二语音拾取模式对所述目标方向范围内的语音信号进行语音拾取。7....
【专利技术属性】
技术研发人员:张明远,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。