基于生物特征的声源追踪方法、装置、设备及存储介质制造方法及图纸

技术编号:21118047 阅读:22 留言:0更新日期:2019-05-16 09:42
本发明专利技术公开了一种基于生物特征的声源追踪方法、装置、设备及存储介质,所述方法包括:获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。本发明专利技术结合声源定位、人脸检测和声纹识别等来实现对追踪对象的追踪定位,提升了追踪的定位效果,提高了追踪的准确性。

Sound Source Tracking Method, Device, Equipment and Storage Medium Based on Biological Characteristics

【技术实现步骤摘要】
基于生物特征的声源追踪方法、装置、设备及存储介质
本专利技术涉及生物特征领域,具体涉及一种基于生物特征的声源追踪方法、装置、设备及存储介质。
技术介绍
目前,随着科学技术的发展,在一些大型会展等现场,如何对发言对象等追踪对象进行智能追踪,是一个很需要解决的问题,由于智能机器人的快速发展,人们也可能也会希望智能机器人能够实现此类追踪的智能操作,比如,通过声源定位技术实现对追踪对象的定位等。但是,在现有技术中,上述的智能追踪并没有得到很好的实现,比如,通过智能机器人对追踪对象进行定位追踪一般都是通过智能机器人的某一方面的技术来实现的,而这种实现方式往往比较片面,准确性低,导致定位效果比较差。
技术实现思路
本专利技术实施例提供一种基于生物特征的声源追踪方法、装置、设备及存储介质,本专利技术结合声源定位、人脸检测和声纹识别等多方面技术来实现对追踪对象的追踪定位,提升了追踪的定位效果,提高了追踪的准确性。一种基于生物特征的声源追踪方法,包括:获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。一种基于生物特征的声源追踪装置,包括:第一提取模块,用于获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;判断模块,用于获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;第二提取模块,用于若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;设定模块,用于在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于生物特征的声源追踪方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述基于生物特征的声源追踪方法的步骤。本专利技术提供的基于生物特征的声源追踪方法、装置、设备及存储介质,首先获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。本专利技术结合声源定位、人脸检测和声纹识别等多方面技术来实现对追踪对象的追踪定位,提升了追踪的定位效果,提高了追踪的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中基于生物特征的声源追踪方法的应用环境示意图;图2是本专利技术一实施例中基于生物特征的声源追踪方法的流程图;图3是本专利技术一实施例中基于生物特征的声源追踪方法的步骤S10的流程图;图4是本专利技术一实施例中基于生物特征的声源追踪方法的步骤S106的流程图;图5是本专利技术一实施例中基于生物特征的声源追踪方法的步骤S20的流程图;图6是本专利技术一实施例中基于生物特征的声源追踪方法的步骤S202的流程图;图7是本专利技术另一实施例中基于生物特征的声源追踪方法的流程图;图8是本专利技术又一实施例中基于生物特征的声源追踪方法的流程图;图9是本专利技术一实施例中基于生物特征的声源追踪装置的原理框图;图10是本专利技术一实施例中计算机设备的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供的基于生物特征的声源追踪方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种基于生物特征的声源追踪方法,以该方法应用在图1中的服务器为例进行说明,包括以下步骤:S10,获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置。其中,所述当前环境是指需要确定当前正在发言的追踪对象并对其进行持续追踪的当前环境(比如会议、演出、主持环境等,亦可以用于需要与所述追踪对象进行互动,因此首先需要确定追踪对象的环境);所述当前环境中根据需求在多个位置分布设有可以捕获声源信号的麦克风。同时,在该当前环境中分布设有多个可以进行拍摄视频和图像的摄像设备(比如摄像头,移动终端等)。可理解地,各所述摄像设备均可以随意旋转角度和/或各所述摄像设备的位置亦可以在一定范围内进行调整(设定调整摄像设备以调整其高低、左右前后、倾斜角度等位置关系),以达到所述当前环境中的所有空间的任何角度均可以被清晰地拍摄到的效果即可。S20,获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话。也即,首先可通过摄像设备捕捉声源位置附近的图片,之后提取所述图片中的人脸。同时,需要进一步根据确认该人脸是否在说话(可以根据该人脸的微表情进行识别其是否正在说话);在其正在说话时,通过将正在说话的人脸的第二声纹特征与上述的声源的第一声纹特征进行匹配,以确认其是否为追踪对象,在该人脸并未在说话时,将其排除出追踪对象的范围。S30,若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征。在该步骤中,在确认该人脸正在说话时,可以提取该说话音频中的第二声纹特征,以便于将该第二声纹特征与上述第一声纹特征进行匹配,进而追踪对象。S40,在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。也即,将说话人脸的第二声纹特征与所述声源的第一声纹特征匹配的说话人脸,确认为与该声源对应的追踪对象,进而通过摄像设备对该说话人脸进行持续追踪。本专利技术提供的基于生物特征的声源追踪方法,首先获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。本专利技术结合声源定位、人脸检测和声纹识别等多方面技术来实现对追踪对象的追踪定位,提升了追踪的定位效果,提高了追踪的准确性。在一实施例中,如图3所示,所述步骤S10包括:S101,获取当前环境中的所有声源,并在所有声源中本文档来自技高网...

【技术保护点】
1.一种基于生物特征的声源追踪方法,其特征在于,包括:获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。

【技术特征摘要】
1.一种基于生物特征的声源追踪方法,其特征在于,包括:获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置;获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话;若该人脸正在说话,获取该人脸的说话音频,并提取所述说话音频中的第二声纹特征;在确定所述第二声纹特征与所述第一声纹特征匹配时,将该人脸设定为追踪对象。2.如权利要求1所述的基于生物特征的声源追踪方法,其特征在于,所述获取当前环境中符合预设声源要求的声源,提取所述声源中的第一声纹特征,并标记该声源所在的声源位置,包括:获取当前环境中的所有声源,并在所有声源中检测是否存在符合预设声源要求的声源;在存在符合预设声源要求的声源时,提取符合预设声源要求的该声源的第一声纹特征;通过声源定位运算对该声源进行定位,获取该声源的声源位置;将所述声源位置以及所述第一声纹特征关联,并在预设的电子地图中标记所述声源位置。3.如权利要求2所述基于生物特征的声源追踪的方法,其特征在于,所述将所述声源位置以及所述第一声纹特征关联,并在预设的电子地图中标记所述声源位置之后,包括:获取所述电子地图中所述声源位置周围预设范围内分布的摄像设备;根据预设的分配规则为所述声源位置分配所述摄像设备。4.如权利要求3所述的基于生物特征的声源追踪方法,其特征在于,所述根据预设的分配规则为所述声源位置分配所述摄像设备,包括:检测所述预设范围内分布的摄像设备是否被标记为未使用;在所述摄像设备被标记为未使用时,检测所述摄像设备是否可以拍摄到所述声源位置的人脸;在所述摄像设备可以拍摄到所述声源位置的人脸时,将所述摄像设备与所述声源位置关联,并将所述摄像设备标记为已使用。5.如权利要求4所述的基于生物特征的声源追踪方法,其特征在于,所述检测所述预设范围内分布的摄像设备是否被标记为未使用之后,还包括:在所述摄像设备均被标记为已使用时,指示其他位置的所述摄像设备移动至所述预设范围中,或扩大所述预设范围。6.如权利要求1所述的基于生物特征的声源追踪方法,其特征在于,所述获取所述声源位置周围预设范围内的人脸,并判断该人脸是否正在说话,包括:获取摄像设备拍摄的所述声源位置周围预设范围内的人脸,并通过静默活体检测判断所述人脸是否属于活体人脸;在所述人脸属于活体人脸时,判断所述人脸当前的第一微表情是否为说话微表情;在所述第一微表情为说话微表情时,确认所述人脸在说话。7.如权利要求6所述的基于生物特征的声源追踪方法,其特征在于,所述在所述人脸属于活体人脸时,判断所述人脸当前的第一微表情是否为说话微表情之后,还包括:在预设时间范围之内检测到的所有第一微表情均不是说话微表情时,确认所述人脸一直未在说话,将该人脸标记为非追踪对象。8.如权利要求6所述的基于生物特征的声源追踪方法,其特征在于,所述判断所述人脸当前的第一微表情是否为说话微表情...

【专利技术属性】
技术研发人员:任婧胡文成曾燕玲
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1