录音方法、装置和系统制造方法及图纸

技术编号:14707194 阅读:56 留言:0更新日期:2017-02-25 18:21
本申请提出一种录音方法、装置和系统,该录音方法包括:获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。该方法能够提高录音质量,同时实现说话人语音分离,从而便于后续录音转写时的角色分离,方便回听回看。

【技术实现步骤摘要】

本申请涉及语音信号处理
,尤其涉及一种录音方法、装置和系统
技术介绍
检察机关在审讯过程中需要对审讯情况和问答内容进行记录,需要耗费相当的人力,语音识别技术的发展为解决这个问题提供了有效的途径。相关技术中,审讯录音大多采用普通拾音器设备,可能是一个或者多个,该设备一般放置在审讯室的墙边或者桌上,对审讯全程的语音进行录制。但是,相关技术中的审讯录音设备具有以下的缺点:首先,录音设备距离发言人距离都比较远,容易受到环境噪声和房间混响的影响,从而导致录音清晰度和可懂度不高,整体质量较差;其次,不管是一个录音器还是多个录音器,都会同时录制所有人的语音,为后续的回听回看造成很大的不方便。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种录音方法,该方法能够提高录音质量,同时实现说话人语音分离,从而便于后续录音转写时的角色分离,方便回听回看。本申请的另一个目的在于提出一种录音装置。本申请的另一个目的在于提出一种录音系统。为达到上述目的,本申请第一方面实施例提出的录音方法,包括:获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。本申请第一方面实施例提出的录音方法,通过将枪型麦克风阵列端向指向第一方,可以实现更远距离的高质量拾音,从而能够提高录音质量;通过进行说话人语音分离,可以便于后续录音转写时的角色分离,方便回听回看。为达到上述目的,本申请第二方面实施例提出的录音装置,包括:获取模块,用于获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;确定模块,用于对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;分离模块,用于根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。本申请第二方面实施例提出的录音装置,通过将枪型麦克风阵列端向指向第一方,可以实现更远距离的高质量拾音,从而能够提高录音质量;通过进行说话人语音分离,可以便于后续录音转写时的角色分离,方便回听回看。为达到上述目的,本申请第三方面实施例提出的录音系统,包括:枪型麦克风阵列、圆型麦克风阵列和录音装置;所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;所述枪型麦克风阵列和圆型麦克风阵列分别用于采集所述第一方和/或待录音的第二方的语音信号,所述第二方的人数为一人或多人;所述录音装置用于对枪型麦克风阵列采集的语音信号和圆型麦克风阵列采集的语音信号进行语音信号处理,得到说话人分离的第一方的录制语音信号和第二方的录制语音信号。本申请第三方面实施例提出的录音系统,通过将枪型麦克风阵列端向指向第一方,可以实现更远距离的高质量拾音,从而能够提高录音质量;通过进行说话人语音分离,可以便于后续录音转写时的角色分离,方便回听回看。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请一个实施例提出的录音系统的结构示意图;图2是本申请一个实施例提出的录音方法的流程示意图;图3是本申请实施例中对语音信号进行波束形成及确定第二方说话人方向的方法的流程示意图;图4是本申请实施例中枪型麦克风阵列空间区域划分示意图;图5是本申请实施例中圆型麦克风阵列空间区域划分示意图;图6是本申请实施例中声源定位示意图;图7是本申请实施例中单个GSC模块的组成示意图;图8是本申请一个实施例提出的录音装置的结构示意图;图9是本申请另一个实施例提出的录音装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。本申请的方案主要应用于双方交谈场景双方语音数据的录制,并且交谈双方中一方为一人,另一方为一人或多人(多人是指至少两人)。如对犯罪嫌疑人的审讯场景,一方为一个被审讯人,另一方为多个审讯人;或者采访场景,一方为被采访人,另一方为多个采访人;或者演讲场景,一方为演讲人,另一方为多个听众(听众会对演讲者提问)等。下面以对犯罪嫌疑人的审讯场景为例,对本申请的方案进行阐述。图1是本申请一个实施例提出的录音系统的结构示意图。如图1所示,本实施例的系统包括:枪型麦克风阵列11、圆型麦克风阵列12录音装置13。其中,枪型麦克风阵列11端向指向待录音的第一方,所述第一方的人数为一人;例如,参见图1,枪型麦克风阵列11端向指向被审讯人,被审讯人为一人。圆型麦克风阵列12的放置方向不限定。枪型麦克风阵列和圆型麦克风阵列可以分别与录音装置通过有线或无线进行连接。在系统设置上,枪型麦克风阵列、圆型麦克风阵列和录音装置可以设置成一个整体,或者分离设置。进一步的,处于安全等方面的考虑,枪型麦克风阵列和圆型麦克风阵列可以放置在远离被审讯人的位置,如放置在审讯桌上。枪型麦克风阵列11和圆型麦克风阵列12分别用于采集第一方和/或待录音的第二方的语音信号,所述第二方的人数为一人或多人。如图1所示,第二方为审讯人员,审讯人员可以为一人或为多人(图1中示出了多人)。根据当前说话人的不同,枪型麦克风阵列和圆型麦克风阵列可以采集到被审讯人的语音,或者采集到审讯人员的语音,或者采集到被审讯人和审讯人员的语音。录音装置13用于对枪型麦克风阵列采集的语音信号和圆型麦克风阵列采集的语音信号进行语音信号处理,得到说话人分离的第一方的录制语音信号和第二方的录制语音信号。录音装置的具体内容可以参见后续实施例的描述。枪型麦克风阵列是由多个麦克风组成的线性阵列,相对于其他阵列形式,线性阵列能够在端向形成指向性更高的波束,接收更小范围内的语音,因此可以实现更远距离的拾音,类似于用枪瞄准某一区域,另外这种线性阵列的硬件外观也与猎枪相似,所以在本申请中将这种麦克风阵列称为枪型麦克风阵列。目前的枪型麦克风阵列都是模拟阵列,而本申请中可以具体使用数字阵列,数字阵列除了能在端向实现高指向性波束外,还能在其他方向实现多个波束并根据需求控制波束形状。圆型麦克风阵列可以是单个环形的麦克风阵列,也可以多个同心圆环麦克风阵列,由于其结构的对称性,对于全空间360度的任意方向,均可以实现相近的拾音波束。在实际审讯场景中,一般只有1个被审讯人,并且在审讯过程中被审讯人的位置是固定的,为了方便和安全考虑,阵列需要放置本文档来自技高网...
录音方法、装置和系统

【技术保护点】
一种录音方法,其特征在于,包括:获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。

【技术特征摘要】
1.一种录音方法,其特征在于,包括:获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一方,所述第一方的人数为一人;对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,其中,所述第二方的人数为一人或多人;根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号。2.根据权利要求1所述的方法,其特征在于,所述对所述第一语音信号和所述第二语音信号分别进行波束形成,根据波束形成输出确定待录音的第二方说话人方向,包括:对第一语音信号进行固定波束形成,得到第一固定波束形成输出;根据第一固定波束形成输出确定当前说话人角色;对第二语音信号进行固定波束形成,得到第二固定波束形成输出;对当前说话人的方向进行声源定位,定位出声源方向;选择定位出的声源方向上的第二固定波束形成输出;获取选择出的第二固定波束形成输出与第一方说话人方向上的第一固定波束形成输出之间的相关系数;根据当前说话人角色、选择出的第二固定波束形成输出、定位出的声源方向个数以及获取的相关系数,确定第二方说话人方向。3.根据权利要求2所述的方法,其特征在于,所述根据第一固定波束形成输出确定当前说话人角色,包括:分别计算第一方说话人方向的第一固定波束形成输出的波束能量和其它方向的第一固定波束形成输出的波束能量和;计算所述波束能量与所述波束能量和之间的比值;在所述比值大于或等于第一能量阈值时,确定当前说话人为第一方;在所述比值小于或等于第二能量阈值时,确定当前说话人为第二方;在所述比值大于第二能量阈值且小于第一能量阈值时,确定当前说话人为第一方和第二方。4.根据权利要求2所述的方法,其特征在于,所述根据当前说话人角色、选择出的第二固定波束形成输出、定位出的声源方向个数以及获取的相关系数,确定第二方说话人方向,包括:如果当前说话人为第一方,则确定第二方说话人方向为上一次定位到的第二方说话人方向;如果当前说话人为第二方,在选择出的第二固定波束形成输出中选取波束能量最大的第二固定波束形成输出,将选取出的第二固定波束形成输出对应的方向确定为第二方说话人方向;如果当前说话人为第一方和第二方,且声源方向为一个,则当所述相关系数大于相关系数阈值时,则确定第二方说话人方向为上一次定位到的第二方说话人方向;当所述相关系数小于或等于相关系数阈值时,则将选择出的第二固定波束形成输出对应的方向确定为第二方说话人方向;如果当前说话人为第一方和第二方,且声源方向大于一个,在选择出的第二固定波束形成输出中去除所述相关系数最大的第二固定波束形成输出,在剩余的第二固定波束形成输出中选取波束能量最大的第二固定波束形成输出,将选取的第二固定波束形成输出对应的方向确定为第二方说话人方向。5.根据权利要求1所述的方法,其特征在于,所述根据第一方说话人方向和所述第二方说话人方向进行说话人语音分离,得到第一方和第二方分离后的录制语音信号,包括:分别将第一方说话人方向和第二方说话人方向作为目标说话人方向,获取目标说话人方向的固定波束输出作为目标波束,以及获取非目标说话人方向的固定波束输出作为参考波束;将目标波束和参考波束作为GSC模块的输入,与GSC模块的阻塞系数和自适应噪声消除系数运算后得到GSC模块的输出,将输出作为分离后的目标说话人的语音信号。6.根据权利要求5所述的方法,其特征在于,当目标说话人方向为第一方说话人方向时,所述参考波束包括:第二语音信号对应的波束形成输出中第二方说话人方向的波束形成输出;当目标说话人方向为第二方说话人方向时,所述参考波束包括:第一语音信号对应的波束形成输出中第一方说话人方向的波束形成输出。7.根据权利要求5所述的方法,其特征在于,所述阻塞系数或自适应噪声消除系数是根据当前说话人角色进行更新的。8.一种录音装置,其特征在于,包括:获取模块,用于获取枪型麦克风阵列采集的第一语音信号和圆型麦克风阵列采集的第二语音信号,其中,所述枪型麦克风阵列端向指向待录音的第一...

【专利技术属性】
技术研发人员:曹圣红王海坤马峰胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1