【技术实现步骤摘要】
本申请涉及语音信号处理
,尤其涉及一种录音方法、装置和系统。
技术介绍
检察机关在审讯过程中需要对审讯情况和问答内容进行记录,需要耗费相当的人力,语音识别技术的发展为解决这个问题提供了有效的途径。相关技术中,审讯录音大多采用普通拾音器设备,可能是一个或者多个,该设备一般放置在审讯室的墙边或者桌上,对审讯全程的语音进行录制。但是,相关技术中的审讯录音设备具有以下的缺点:首先,录音设备距离发言人距离都比较远,容易受到环境噪声和房间混响的影响,从而导致录音清晰度和可懂度不高,整体质量较差;其次,不管是一个录音器还是多个录音器,都会同时录制所有人的语音,为后续的回听回看造成很大的不方便。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种录音方法,该方法能够提高录音质量,同时实现说话人语音分离,从而便于后续录音转写时的角色分离,方便回听回看。本申请的另一个目的在于提出一种录音装置。本申请的另一个目的在于提出一种录音系统。为达到上述目的,本申请第一方面实施例提出的录音方法,包括:获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。本申请第一方面实施例提出的录音方法,通过将枪型麦克风阵列 ...
【技术保护点】
一种录音方法,其特征在于,包括:获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。
【技术特征摘要】
1.一种录音方法,其特征在于,包括:获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。2.根据权利要求1所述的方法,其特征在于,所述对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,包括:对第一语音信号进行固定波束形成,得到第一固定波束形成输出;根据第一固定波束形成输出确定当前说话人角色;对第二语音信号进行固定波束形成,得到第二固定波束形成输出;对当前说话人的方向进行声源定位,定位出声源方向;选择定位出的声源方向上的第二固定波束形成输出;获取选择出的第二固定波束形成输出与第一方说话人方向上的第一固定波束形成输出之间的相关系数;根据当前说话人角色、选择出的第二固定波束形成输出、定位出的声源方向个数以及获取的相关系数,确定第二方说话人方向。3.根据权利要求2所述的方法,其特征在于,所述根据第一固定波束形成输出确定当前说话人角色,包括:分别计算第一方说话人方向的第一固定波束形成输出的波束能量和其它方向的第一固定波束形成输出的波束能量和;计算所述波束能量与所述波束能量和之间的比值;在所述比值大于或等于第一能量阈值时,确定当前说话人为第一方;在所述比值小于或等于第二能量阈值时,确定当前说话人为第二方;在所述比值大于第二能量阈值且小于第一能量阈值时,确定当前说话人为第一方和第二方。4.根据权利要求2所述的方法,其特征在于,所述根据当前说话人角色、选择出的第二固定波束形成输出、定位出的声源方向个数以及获取的相关系数,确定第二方说话人方向,包括:如果当前说话人为第一方,则确定第二方说话人方向为上一次定位到的第二方说话人方向;如果当前说话人为第二方,在选择出的第二固定波束形成输出中选取波束能量最大的第二固定波束形成输出,将选取出的第二固定波束形成输出对应的方向确定为第二方说话人方向;如果当前说话人为第一方和第二方,且声源方向为一个,则当所述相关系数大于相关系数阈值时,则确定第二方说话人方向为上一次定位到的第二方说话人方向;当所述相关系数小于或等于相关系数阈值时,则将选择出的第二固定波束形成输出对应的方向确定为第二方说话人方向;如果当前说话人为第一方和第二方,且声源方向大于一个,在选择出的第二固定波束形成输出中去除所述相关系数最大的第二固定波束形成输出,在剩余的第二固定波束形成输出中选取波束能量最大的第二固定波束形成输出,将选取的第二固定波束形成输出对应的方向确定为第二方说话人方向。5.根据权利要求1所述的方法,其特征在于,所述根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号,包括:分别将第一方说话人方向和第二方说话人方向作为目标说话人方向,获取目标说话人方向的固定波束输出作为目标波束,以及获取非目标说话人方向的固定波束输出作为参考波束;将目标波束和参考波束作为GSC模块的输入,与GSC模块的阻塞系数和自适应噪声消除系数运算后得到GSC模块的输出,将输出作为分离后的目标说话人的语音信号。6.根据权利要求5所述的方法,其特征在于,当目标说话人方向为第一方说话人方向时,所述参考波束包括:第二语音信号对应的波束形成输出中第二方说话人方向的波束形成输出;当目标说话人方向为第二方说话人方向时,所述参考波束包括:第一语音信号对应的波束形成输出中第一方说话人方向的波束形成输出。7.根据权利要求5所述的方法,其特征在于,所述阻塞系数或自适应噪声消除系数是根据当前说话人角色进行更新的。8.一种录音装置,其特征在于,包括:获取模块,用于获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一...
【专利技术属性】
技术研发人员:曹圣红,王海坤,马峰,胡国平,胡郁,刘庆峰,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。