一种语音信号处理方法、装置及系统制造方法及图纸

技术编号:13502562 阅读:144 留言:0更新日期:2016-08-10 00:05
本发明专利技术公开了一种语音信号处理方法、装置及系统,其中该方法包括以下步骤:获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;根据位置信息,获取目标声源发出语音信息到每个麦克风获取到语音信息的延迟时间;根据延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取目标声源发出的语音信息。本发明专利技术能够对目标声源进行准确定位,对目标声源语音信号处理效果佳,可将处理后目标声源语音进行本地播放或远端通讯,还可将标记的各声源语音分别处理后存储取证,有很高的灵活性。

【技术实现步骤摘要】

本专利技术涉及音视频
,具体涉及一种语音信号处理方法、装置及系统
技术介绍
随着音视频技术的快速发展,摄像机与麦克风阵列设备已经在视频监控、视频会议等应用场合中不可或缺。不幸的是,在我们可以获取清晰录像的同时,音频通讯通常会遭受干扰声源、噪声和混响的影响,使得难以听清摄像现场的讲话内容。为改善不利环境中音频讯号的接收,麦克风阵列通常被应用来对声源定位,并对声源方向进行波束形成等语音信号处理。然而在多人声嘈杂环境中时,目前的阵列麦克风技术在面对复杂的声学场景时,则无法进行声源定位,因此对声源发出的语音信息进行语音信号处理的效果难以保证,抑制噪声干扰能力差。
技术实现思路
因此,本专利技术实施例要解决的技术问题在于现有技术中的语音信号处理系统在复杂多人声环境中的抑制噪声干扰能力差。为此,本专利技术实施例的一种语音信号处理方法,包括以下步骤:获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取所述目标声源发出的语音信息。优选地,所述获取目标声源相对于麦克风阵列中的每个麦克风的位置信息包括:获取所述目标声源相对于摄像机的位置信息;根据所述目标声源相对于所述摄像机的位置信息和预设的麦克风阵列与摄像机之间的位置关系,获取目标声源相对于麦克风阵列中的每个麦克风的位置信息。优选地,所述获取所述目标声源相对于摄像机的位置信息包括:接收摄像机发送的包含声源的现场视频信息和在所述现场视频信息包含的所有声源中选取的目标声源;根据所述现场视频信息,获取所述目标声源相对于所述摄像机的位置信息。优选地,所述获取目标声源相对于麦克风阵列中的每个麦克风的位置信息还包括:利用麦克风阵列的空间几何构造和麦克风相互间的相关性统计对获取到的所述目标声源相对于麦克风阵列中的每个麦克风的位置信息进行校验调整,获取校验调整后的位置信息。优选地,还包括以下步骤:将获取到的所述目标声源发出的语音信息发送至本地扬声器进行播放、发送至通信装置进行与远端装置的语音信息交互或者发送至存储装置进行存储。本专利技术实施例的一种语音信号处理装置,包括:位置获取单元,用于获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;时延获取单元,用于根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;语音获取单元,用于根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取所述目标声源发出的语音信息。优选地,所述位置获取单元包括:第一位置获取子单元,用于获取所述目标声源相对于摄像机的位置信息;第二位置获取子单元,用于根据所述目标声源相对于所述摄像机的位置信息和预设的麦克风阵列与摄像机之间的位置关系,获取目标声源相对于麦克风阵列中的每个麦克风的位置信息。优选地,所述第一位置获取子单元包括:接收单元,用于接收摄像机发送的包含声源的现场视频信息和在所述现场视频信息包含的所有声源中选取的目标声源;位置获取子子单元,用于根据所述现场视频信息,获取所述目标声源相对于所述摄像机的位置信息。优选地,所述位置获取单元还包括:位置校验调整单元,用于利用麦克风阵列的空间几何构造和麦克风相互间的相关性统计对获取到的所述目标声源相对于麦克风阵列中的每个麦克风的位置信息进行校验调整,获取校验调整后的位置信息。优选地,还包括:发送单元,用于将获取到的所述目标声源发出的语音信息发送至本地扬声器进行播放、发送至通信装置进行与远端装置的语音信息交互或者发送至存储装置进行存储。本专利技术实施例的一种语音信号处理系统,包括:摄像机,用于获取包含声源的现场视频信息并发送给语音信号处理装置;麦克风阵列,用于获取目标声源发出的语音信息并发送给语音信号处理装置;语音信号处理装置,用于接收摄像机发送的包含声源的现场视频信息;根据所述现场视频信息获取所述目标声源相对于所述摄像机的位置信息;根据所述目标声源相对于所述摄像机的位置信息和预设的麦克风阵列与摄像机之间的位置关系,获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取所述目标声源发出的语音信息。优选地,所述语音信号处理装置,还用于利用麦克风阵列的空间几何构造和麦克风相互间的相关性统计对获取到的所述目标声源相对于麦克风阵列中的每个麦克风的位置信息进行校验调整,获取校验调整后的位置信息。优选地,所述语音信号处理装置,还用于将获取到的所述目标声源发出的语音信息发送至本地扬声器进行播放、发送至通信装置进行与远端装置的语音信息交互或者发送至存储装置进行存储。优选地,还包括:显示装置,用于显示现场视频信息,获取所选取的目标声源并发送给所述语音信号处理装置;扬声器装置,用于获取所述语音信号处理装置发送的所述目标声源发出的语音信息并进行播放;通信装置,用于获取所述语音信号处理装置发送的所述目标声源发出的语音信息并进行与远端装置的语音信息交互;存储装置,用于获取所述语音信号处理装置发送的所述目标声源发出的语音信息并进行存储。本专利技术实施例的技术方案,具有如下优点:1.本专利技术实施例提供的语音信号处理方法、装置及系统,通过获取目标声源相对于麦克风阵列中每个麦克风的位置信息,可以直接估算出每个麦克风获取到目标声源发出的语音信息的时延,再结合目标声源的位置,在对语音信息进行语音信号处理时,可以降低复杂多人声环境中其他声源对麦克风语音获取过程中的影响,从而语音信号处理后的效果好,也提高了抑制干扰的能力。2.本专利技术实施例提供的语音信号处理方法、装置及系统,通过采集目标声源相对于摄像机的位置信息,再结合预设的麦克风阵列与摄像机之间的位置关系,能够精确的获取到目标声源相对于麦克风阵列中的每个麦克风的位置信息,提高了对目标声源的定位精度,从而能够进一步改善语音...

【技术保护点】
一种语音信号处理方法,其特征在于,包括以下步骤:获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取所述目标声源发出的语音信息。

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括以下步骤:
获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;
根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所
述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;
根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,
获取所述目标声源发出的语音信息。
2.根据权利要求1所述的方法,其特征在于,所述获取目标声源相对
于麦克风阵列中的每个麦克风的位置信息包括:
获取所述目标声源相对于摄像机的位置信息;
根据所述目标声源相对于所述摄像机的位置信息和预设的麦克风阵列
与摄像机之间的位置关系,获取目标声源相对于麦克风阵列中的每个麦克
风的位置信息。
3.根据权利要求2所述的方法,其特征在于,所述获取所述目标声源
相对于摄像机的位置信息包括:
接收摄像机发送的包含声源的现场视频信息和在所述现场视频信息包
含的所有声源中选取的目标声源;
根据所述现场视频信息,获取所述目标声源相对于所述摄像机的位置
信息。
4.根据权利要求2或3所述的方法,其特征在于,所述获取目标声源
相对于麦克风阵列中的每个麦克风的位置信息还包括:
利用麦克风阵列的空间几何构造和麦克风相互间的相关性统计对获取

\t到的所述目标声源相对于麦克风阵列中的每个麦克风的位置信息进行校验
调整,获取校验调整后的位置信息。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括以下步
骤:
将获取到的所述目标声源发出的语音信息发送至本地扬声器进行播放、
发送至通信装置进行与远端装置的语音信息交互或者发送至存储装置进行
存储。
6.一种语音信号处理装置,其特征在于,包括:
位置获取单元,用于获取目标声源相对于麦克风阵列中的每个麦克风
的位置信息;
时延获取单元,用于根据目标声源相对于麦克风阵列中的每个麦克风
的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语
音信息的延迟时间;
语音获取单元,用于根据所述延迟时间,对来自各个麦克风的语音信
息进行语音信号处理,获取所述目标声源发出的语音信息。
7.根据权利要求6所述的装置,其特征在于,所述位置获取单元包括:
第一位置获取子单元,用于获取所述目标声源相对于摄像机的位置信
息;
第二位置获取子单元,用于根据所述目标声源相对于所述摄像机的位
置信息和预设的麦克风阵列与摄像机之间的位置关系,获取目标声源相对
于麦克风阵列中的每个麦克风的位置信息。
8.根据权利要求7所述的装置,其特征在于,所述第一位置获取子单

\t元包括:
接收单元,用于接收摄像机发送的包含声源的现...

【专利技术属性】
技术研发人员:刘焕汤峰峰修平平鄢仁祥曹李军
申请(专利权)人:苏州科达科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1