语音转录设备、系统、方法、及电子设备技术方案

技术编号:23485624 阅读:14 留言:0更新日期:2020-03-10 12:53
本申请公开了语音转录设备、系统和方法,以及电子设备。其中,语音转录设备,通过传声器阵列采集阵列接收范围内的语音信号;若所述语音信号包括话音信号,则确定所述话音信号的声源位置;若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;将所述目标话音信号发送至语音转录服务器,以使得所述服务器对所述目标话音信号进行语音转录。采用这种处理方式,使得基于传声器阵列对拾音区域内的话音信号进行多麦克增强,同时根据声源位置判断是否是目标话音,对于目标区域外的声音进行过滤,保证区域外声音不会传入到转录服务器;因此,可以有效确保拾到目标话音,提升对非目标话音的抗干扰能力,从而提升语音转录质量。

Speech transcription equipment, system, method and electronic equipment

【技术实现步骤摘要】
语音转录设备、系统、方法、及电子设备
本申请涉及语音信号处理
,具体涉及语音转录设备、系统和方法,以及电子设备。
技术介绍
语音转录技术是近年来语音信号处理领域的一大研究热点。随着研究的不断深入,目前该项技术已经在庭审现场和多人会议等场合中得到了广泛的应用。图1示出了一种常见的语音转录现场示意图。该方案在每个人面前配置一个鹅颈麦克设备,通过鹅颈麦克设备采集每个人的音频,将采集到的音频传送至音频处理装置,由音频处理装置对采集到的原始音频进行扩音处理,再将扩音后的音频发送至转录云服务,通过转录云服务进行对扩音后的音频进行语音转录处理。然而,在实现本专利技术过程中,专利技术人发现该技术方案至少存在如下问题:1)由于鹅颈麦克风本身的限制,其有效的拾音区域非常小,当用户偏离其有效区域或者距离过远的时候,用户的声音会被抑制,导致声音忽大忽小,影响转录效果;2)由于鹅颈麦克风对声音的抑制效果又是有限的,周围人的声音也很容易被采集进去,因此在多人会议的时候或者庭审现场有噪声和回放等干扰条件下,抗干扰能力差,导致转录出现串音。综上所述,现有技术存在拾不到目标话音且外部串音干扰的问题。
技术实现思路
本申请提供语音转录设备,以解决现有技术存在的拾不到目标话音且外部串音干扰的问题。本申请另外提供语音转录系统和方法,以及电子设备。本申请提供一种语音转录设备,包括:语音采集装置,用于通过传声器阵列采集阵列接收范围内的语音信号;声源定位装置,用于若所述语音信号包括话音信号,则确定所述话音信号的声源位置;目标话音过滤装置,用于若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;信号发送装置,用于将所述目标话音信号向外发送,以使得语音转录服务器对所述目标话音信号进行语音转录。可选的,还包括:语音降噪装置,用于根据所述声源位置,对所述目标话音信号进行语音增强;所述信号发送装置,具体用于将增强后的目标话音信号向外发送。可选的,还包括:噪声协方差确定装置,用于若所述语音信号包括噪音信号,则确定所述语音信号的噪声协方差;所述语音降噪装置,还用于根据所述噪声协方差,对所述噪音信号进行抑制。可选的,还包括:目标范围配置装置,用于获取所述目标范围,存储所述目标范围。可选的,还包括:所述目标话音过滤装置,还用于若所述声源位置不在所述目标范围内,则屏蔽所述话音信号。可选的,所述传声器阵列的排布方式包括:方形阵列或圆形阵列。可选的,还包括:话音检测装置,用于检测所述语音信号是否包括话音信号;若是,则启动所述声源定位装置。可选的,还包括:话音检测装置,用于检测所述语音信号是否包括所述噪音信号;若是,则启动所述噪声协方差确定装置。本申请还提供一种语音转录系统,包括:上述的语音转录设备,以及,语音转录服务器;其中,所述服务器,用于对所述语音转录设备上传的目标话音信号进行语音转录。本申请还提供一种语音转录方法,包括:通过传声器阵列采集阵列接收范围内的语音信号;若所述语音信号包括话音信号,则确定所述话音信号的声源位置;若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;将所述目标话音信号向外发送,以使得语音转录服务器对所述目标话音信号进行语音转录。可选的,还包括:根据所述声源位置,对所述目标话音信号进行语音增强;所述将所述目标话音信号向外发送,包括:将增强后的目标话音信号向外发送。可选的,还包括:若所述语音信号包括噪音信号,则确定所述语音信号的噪声协方差;根据所述噪声协方差,对所述噪音信号进行抑制。可选的,还包括:获取所述目标范围,对应所述传声器阵列存储所述目标范围。可选的,还包括:若所述声源位置不在所述目标范围内,则屏蔽所述话音信号。可选的,还包括:检测所述语音信号是否包括话音信号;以及,检测所述语音信号是否包括所述噪音信号。本申请还提供一种电子设备,包括:传声器阵列;处理器;以及存储器,用于存储实现语音转录方法的程序,该设备通电并通过所述处理器运行该语音转录方法的程序后,执行下述步骤:通过所述传声器阵列采集阵列接收范围内的语音信号;若所述语音信号包括话音信号,则确定所述话音信号的声源位置;若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;将所述目标话音信号向外发送,以使得语音转录服务器对所述目标话音信号进行语音转录。本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各种方法。本申请还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种方法。与现有技术相比,本申请具有以下优点:本申请实施例提供的语音转录设备,通过传声器阵列采集阵列接收范围内的语音信号;若所述语音信号包括话音信号,则确定所述话音信号的声源位置;若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;将所述目标话音信号发送至语音转录服务器,以使得所述服务器对所述目标话音信号进行语音转录;这种处理方式,使得基于传声器阵列对拾音区域内的话音信号进行多麦克增强,同时根据声源位置判断是否是目标话音,对于目标区域外的声音进行过滤,保证区域外声音不会传入到转录服务器;因此,可以有效确保拾到目标话音,提升对非目标话音的抗干扰能力,从而提升语音转录质量。附图说明图1是现有技术下的语音转录场景图;图2是本申请提供的一种语音转录设备的实施例的结构示意图;图3是本申请提供的一种语音转录设备的实施例的传声器阵列示意图;图4是本申请提供的一种语音转录设备的实施例的具体结构示意图;图5是本申请提供的一种语音转录设备的实施例的又一具体结构示意图;图6是本申请提供的一种语音转录设备的实施例的数据处理流程图;图7是本申请提供的一种语音转录系统的实施例的系统示意图;图8是本申请提供的一种语音转录系统的实施例的场景示意图;图9是本申请提供的一种语音转录方法的实施例的具体流程图;图10是本申请提供的电子设备的实施例的示意图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。在本申请中,提供了语音转录系统、方法和装置,以及电子设备。在下面的实施例中逐一对各种方案进行详细说明。第一实施例请参考图2,其为本申请提供的一种语音转录设备的实施例的示意图,该设备包括:语音采集装置1,声源定位装置2,目标话音过滤装置3,以及,信号发送装置4。...

【技术保护点】
1.一种语音转录设备,其特征在于,包括:/n语音采集装置,用于通过传声器阵列采集阵列接收范围内的语音信号;/n声源定位装置,用于若所述语音信号包括话音信号,则确定所述话音信号的声源位置;/n目标话音过滤装置,用于若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;/n信号发送装置,用于将所述目标话音信号向外发送,以使得语音转录服务器对所述目标话音信号进行语音转录。/n

【技术特征摘要】
1.一种语音转录设备,其特征在于,包括:
语音采集装置,用于通过传声器阵列采集阵列接收范围内的语音信号;
声源定位装置,用于若所述语音信号包括话音信号,则确定所述话音信号的声源位置;
目标话音过滤装置,用于若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;
信号发送装置,用于将所述目标话音信号向外发送,以使得语音转录服务器对所述目标话音信号进行语音转录。


2.根据权利要求1所述的设备,其特征在于,还包括:
语音降噪装置,用于根据所述声源位置,对所述目标话音信号进行语音增强;
所述信号发送装置,具体用于将增强后的目标话音信号向外发送。


3.根据权利要求2所述的设备,其特征在于,还包括:
噪声协方差确定装置,用于若所述语音信号包括噪音信号,则确定所述语音信号的噪声协方差;
所述语音降噪装置,还用于根据所述噪声协方差,对所述噪音信号进行抑制。


4.根据权利要求1所述的设备,其特征在于,还包括:
目标范围配置装置,用于获取所述目标范围,存储所述目标范围。


5.根据权利要求1所述的设备,其特征在于,还包括:
所述目标话音过滤装置,还用于若所述声源位置不在所述目标范围内,则屏蔽所述话音信号。


6.根据权利要求1所述的设备,其特征在于,
所述传声器阵列的排布方式包括:方形阵列或圆形阵列。


7.根据权利要求1所述的设备,其特征在于,还包括:
话音检测装置,用于检测所述语音信号是否包括话音信号;若是,则启动所述声源定位装置。


8.根据权利要求2所述的设备,其特征在于,还包括:
话音检测装置,用于检测所述语音信号是否包括所述噪音信号;若是,则启动所述噪声协方差确定装置。


9.一种语音转录系统,其特征在于,包括:
根据上述权利要求1-8任一项所述的语音转录设备,以及,语音转录...

【专利技术属性】
技术研发人员:余涛许云峰刘章
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1