基于生物特征的声源追踪方法、装置、设备及存储介质制造方法及图纸

技术编号：21118047 阅读：22 留言：0更新日期：2019-05-16 09:42

本发明专利技术公开了一种基于生物特征的声源追踪方法、装置、设备及存储介质，所述方法包括：获取当前环境中符合预设声源要求的声源，提取所述声源中的第一声纹特征，并标记该声源所在的声源位置；获取所述声源位置周围预设范围内的人脸，并判断该人脸是否正在说话；若该人脸正在说话，获取该人脸的说话音频，并提取所述说话音频中的第二声纹特征；在确定所述第二声纹特征与所述第一声纹特征匹配时，将该人脸设定为追踪对象。本发明专利技术结合声源定位、人脸检测和声纹识别等来实现对追踪对象的追踪定位，提升了追踪的定位效果，提高了追踪的准确性。

Sound Source Tracking Method, Device, Equipment and Storage Medium Based on Biological Characteristics

全部详细技术资料下载

【技术实现步骤摘要】
基于生物特征的声源追踪方法、装置、设备及存储介质
本专利技术涉及生物特征领域，具体涉及一种基于生物特征的声源追踪方法、装置、设备及存储介质。
技术介绍
目前，随着科学技术的发展，在一些大型会展等现场，如何对发言对象等追踪对象进行智能追踪，是一个很需要解决的问题，由于智能机器人的快速发展，人们也可能也会希望智能机器人能够实现此类追踪的智能操作，比如，通过声源定位技术实现对追踪对象的定位等。但是，在现有技术中，上述的智能追踪并没有得到很好的实现，比如，通过智能机器人对追踪对象进行定位追踪一般都是通过智能机器人的某一方面的技术来实现的，而这种实现方式往往比较片面，准确性低，导致定位效果比较差。
技术实现思路
本专利技术实施例提供一种基于生物特征的声源追踪方法、装置、设备及存储介质，本专利技术结合声源定位、人脸检测和声纹识别等多方面技术来实现对追踪对象的追踪定位，提升了追踪的定位效果，提高了追踪的准确性。一种基于生物特征的声源追踪方法，包括：获取当前环境中符合预设声源要求的声源，提取所述声源中的第一声纹特征，并标记该声源所在的声源位置；获取所述声源位置周围预设范围内的人脸，并判断该人脸是否正在说话；若该人脸正在说话，获取该人脸的说话音频，并提取所述说话音频中的第二声纹特征；在确定所述第二声纹特征与所述第一声纹特征匹配时，将该人脸设定为追踪对象。一种基于生物特征的声源追踪装置，包括：第一提取模块，用于获取当前环境中符合预设声源要求的声源，提取所述声源中的第一声纹特征，并标记该声源所在的声源位置；判断模块，用于获取所述声源位置周围预设范围内的人脸，并判断该人脸是否正在说话...

【技术保护点】
1.一种基于生物特征的声源追踪方法，其特征在于，包括：获取当前环境中符合预设声源要求的声源，提取所述声源中的第一声纹特征，并标记该声源所在的声源位置；获取所述声源位置周围预设范围内的人脸，并判断该人脸是否正在说话；若该人脸正在说话，获取该人脸的说话音频，并提取所述说话音频中的第二声纹特征；在确定所述第二声纹特征与所述第一声纹特征匹配时，将该人脸设定为追踪对象。

【技术特征摘要】
1.一种基于生物特征的声源追踪方法，其特征在于，包括：获取当前环境中符合预设声源要求的声源，提取所述声源中的第一声纹特征，并标记该声源所在的声源位置；获取所述声源位置周围预设范围内的人脸，并判断该人脸是否正在说话；若该人脸正在说话，获取该人脸的说话音频，并提取所述说话音频中的第二声纹特征；在确定所述第二声纹特征与所述第一声纹特征匹配时，将该人脸设定为追踪对象。2.如权利要求1所述的基于生物特征的声源追踪方法，其特征在于，所述获取当前环境中符合预设声源要求的声源，提取所述声源中的第一声纹特征，并标记该声源所在的声源位置，包括：获取当前环境中的所有声源，并在所有声源中检测是否存在符合预设声源要求的声源；在存在符合预设声源要求的声源时，提取符合预设声源要求的该声源的第一声纹特征；通过声源定位运算对该声源进行定位，获取该声源的声源位置；将所述声源位置以及所述第一声纹特征关联，并在预设的电子地图中标记所述声源位置。3.如权利要求2所述基于生物特征的声源追踪的方法，其特征在于，所述将所述声源位置以及所述第一声纹特征关联，并在预设的电子地图中标记所述声源位置之后，包括：获取所述电子地图中所述声源位置周围预设范围内分布的摄像设备；根据预设的分配规则为所述声源位置分配所述摄像设备。4.如权利要求3所述的基于生物特征的声源追踪方法，其特征在于，所述根据预设的分配规则为所述声源位置分配所述摄像设备，包括：检测所述预设范围内分布的摄像设备是否被标记为未使用；在所述摄像设备被标记为未使用时，检测所述摄像设备是否可以拍摄到所述声源位置的人脸；在所述摄像设备可以拍摄到所述声源位置的人脸时，将所述摄像设备与所述声源位置关联，并将所述摄像设备标记为已使用。5.如权利要求4所述的基于生物特征的声源追踪方法，其特征在于，所述检测所述预设范围内分布的摄像设备是否被标记为未使用之后，还包括：在所述摄像设备均被标记为已使用时，指示其他位置的所述摄像设备移动至所述预设范围中，或扩大所述预设范围。6.如权利要求1所述的基于生物特征的声源追踪方法，其特征在于，所述获取所述声源位置周围预设范围内的人脸，并判断该人脸是否正在说话，包括：获取摄像设备拍摄的所述声源位置周围预设范围内的人脸，并通过静默活体检测判断所述人脸是否属于活体人脸；在所述人脸属于活体人脸时，判断所述人脸当前的第一微表情是否为说话微表情；在所述第一微表情为说话微表情时，确认所述人脸在说话。7.如权利要求6所述的基于生物特征的声源追踪方法，其特征在于，所述在所述人脸属于活体人脸时，判断所述人脸当前的第一微表情是否为说话微表情之后，还包括：在预设时间范围之内检测到的所有第一微表情均不是说话微表情时，确认所述人脸一直未在说话，将该人脸标记为非追踪对象。8.如权利要求6所述的基于生物特征的声源追踪方法，其特征在于，所述判断所述人脸当前的第一微表情是否为说话微表情...

【专利技术属性】
技术研发人员：任婧，胡文成，曾燕玲，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人