一种利用声源定位技术的音视频采集追踪方法及装置制造方法及图纸

技术编号:38238175 阅读:14 留言:0更新日期:2023-07-25 18:02
本申请公开了一种利用声源定位技术的音视频采集追踪方法及装置。所述利用声源定位技术的音视频采集追踪方法包括:获取监测场景中的可疑人员的声源位置;根据可疑人员的声源位置生成位置信息;将位置信息传递给摄像系统,以使摄像系统朝向所述位置信息进行拍摄。本申请通过声源定位追踪技术,将前端采集数据更精准化,使采集到的数据更有价值。完成异常事件定向采集功能。定向采集功能。定向采集功能。

【技术实现步骤摘要】
一种利用声源定位技术的音视频采集追踪方法及装置


[0001]本申请涉及监控
,具体涉及一种利用声源定位技术的音视频采集追踪方法以及利用声源定位技术的音视频采集追踪装置。

技术介绍

[0002]现有技术中,视频监控摄像机仅支持音频输入输出功能,由于监控用拾音器及话筒的局限性,仅能做到在视频图像上叠加音频,在智能化应用的今天,已不能满足音视频采集的智能化需求。本专利技术意在解决音视频单一采集数据的技术瓶颈,采用音频采集的声源定位技术,通过摄像机及拾音器的定向部署,将智能音频与摄像机智能采集相结合,通过几个拾音器拾取的音频情况,对音源的位置进行定位,并将定位的坐标或位置信息传输给可旋转摄像机,旋转摄像机根据拾音器提供的音源位置旋转至音源发生地,完成音视频图像定向采集;通过智能音频分析技术与摄像机智能分析技术,可完成异常事件定向采集功能。
[0003]因此,希望有一种技术方案来解决或至少减轻现有技术的上述不足。

技术实现思路

[0004]本专利技术的目的在于提供一种利用声源定位技术的音视频采集追踪方法来至少解决上述的一个技术问题。
[0005]本专利技术的一个方面,提供一种利用声源定位技术的音视频采集追踪方法,所述利用声源定位技术的音视频采集追踪方法包括:
[0006]获取监测场景中的可疑人员的声源位置;
[0007]根据可疑人员的声源位置生成位置信息;
[0008]将位置信息传递给摄像系统,以使摄像系统朝向所述位置信息进行拍摄。
[0009]可选地,在所述获取可疑人员的声源位置之前,所述利用声源定位技术的音视频采集追踪方法进一步包括:
[0010]获取监测场景的阵列内声源位置数据。
[0011]可选地,所述获取监测场景的阵列内声源位置数据包括:
[0012]通过深层神经网络模型训练模拟出现场RIR情况;
[0013]通过四个拾音器组成阵列,经过现场训练后可得到阵列内声源位置数据。
[0014]可选地,所述获取监测场景中的可疑人员的声源位置包括:
[0015]获取检测场景中的声纹信息;
[0016]获取预设数据库,所述预设数据库包括至少一个预设声纹信息;
[0017]判断所述声纹信息是否与一个预设声纹信息匹配,若是,则
[0018]获取该声纹信息的声源位置。
[0019]可选地,所述根据可疑人员的声源位置生成位置信息包括:
[0020]以获取声纹信息的位置为原点建立球坐标系;
[0021]提取所述声纹信息中的特征信息;
[0022]获取声学传播模型;
[0023]将所述特征信息输入至所述声学传播模型,从而获取声源位置在所述球坐标系中的位置信息。
[0024]可选地,所述利用声源定位技术的音视频采集追踪方法进一步包括:
[0025]获取摄像系统朝向所述位置信息进行拍摄所获取的图像信息;
[0026]识别所述图像信息,从而获取图像信息中的人脸信息;
[0027]获取人脸数据库,所述人脸数据库包括至少一个预设人脸信息;
[0028]判断所述人脸信息是否与一个所述预设人脸信息的相似度超过第一人脸相似度阈值,若是,则
[0029]生成报警信息。
[0030]可选地,所述利用声源定位技术的音视频采集追踪方法进一步包括:
[0031]获取摄像系统朝向所述位置信息进行拍摄所获取的图像信息;
[0032]识别所述图像信息,从而获取图像信息中的步态信息;
[0033]获取步态数据库,所述步态数据库包括至少一个预设步态信息;
[0034]判断所述步态信息是否与一个所述预设步态信息的相似度超过第一步态相似度阈值,若是,则
[0035]生成报警信息。
[0036]可选地,在生成报警信息之前,所述利用声源定位技术的音视频采集追踪方法进一步包括:
[0037]根据所述预设人脸信息生成人脸置信度;
[0038]根据所述步态信息生成步态置信度;
[0039]根据所述人脸置信度以及所述步态置信度判断是否生成报警信息,若是,则
[0040]生成报警信息。
[0041]可选地,所述根据所述人脸置信度以及所述步态置信度判断是否生成报警信息包括:
[0042]获取人脸信息与超过第一人脸相似度阈值的预设人脸信息的相似度值作为第一相似度值;
[0043]获取步态信息与超过第一步态相似度阈值的预设步态信息的相似度值作为第二相似度值;
[0044]获取预设因子库,所述预设因子库包括因子值,每个因子值对应一个预设比值信息;
[0045]获取第一相似度值与所述第二相似度值的比值信息;
[0046]获取预设因子库内的与比值信息相同的预设比值信息所对应的因子值;
[0047]将所述因子值与第一相似度值相乘后再除以第二相似度值从而获取最终置信度值;
[0048]判断获取的最终置信度值是否超过预设置信度值,若是,则
[0049]生成报警信息。
[0050]本申请还提供了一种利用声源定位技术的音视频采集追踪装置,所述利用声源定位技术的音视频采集追踪装置包括:
[0051]声源位置获取模块,所述声源位置获取模块用于获取监测场景中的可疑人员的声源位置;
[0052]位置信息生成模块,位置信息生成模块用于根据可疑人员的声源位置生成位置信息;
[0053]传输模块,所述传输模块用于将位置信息传递给摄像系统,以使摄像系统朝向所述位置信息进行拍摄。
[0054]有益效果
[0055]本申请通过声源定位追踪技术,将前端采集数据更精准化,使采集到的数据更有价值。完成异常事件定向采集功能。
附图说明
[0056]图1是本申请一实施例的利用声源定位技术的音视频采集追踪方法的流程示意图。
[0057]图2是能够实现本申请一实施例的利用声源定位技术的音视频采集追踪方法的电子设备的示意图。
[0058]图3是本申请一实施例的声源定位的原理示意图。
[0059]图4为本申请一实施例的监控场景示意图。
[0060]图5为本申请一实施例的声学传播模型的示意图。
[0061]图6位本申请一实施例的声源位置计算原理示意图。
具体实施方式
[0062]为使本申请实施的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行更加详细的描述。在附图中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本申请一部分实施例,而不是全部的实施例。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。下面结合附图对本申请的实施例进行详细说明。
[0063]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用声源定位技术的音视频采集追踪方法,其特征在于,所述利用声源定位技术的音视频采集追踪方法包括:获取监测场景中的可疑人员的声源位置;根据可疑人员的声源位置生成位置信息;将位置信息传递给摄像系统,以使摄像系统朝向所述位置信息进行拍摄。2.如权利要求1所述的利用声源定位技术的音视频采集追踪方法,其特征在于,在所述获取可疑人员的声源位置之前,所述利用声源定位技术的音视频采集追踪方法进一步包括:获取监测场景的阵列内声源位置数据。3.如权利要求2所述的利用声源定位技术的音视频采集追踪方法,其特征在于,所述获取监测场景的阵列内声源位置数据包括:通过深层神经网络模型训练模拟出现场RIR情况;通过四个拾音器组成阵列,经过现场训练后可得到阵列内声源位置数据。4.如权利要求3所述的利用声源定位技术的音视频采集追踪方法,其特征在于,所述获取监测场景中的可疑人员的声源位置包括:获取检测场景中的声纹信息;获取预设数据库,所述预设数据库包括至少一个预设声纹信息;判断所述声纹信息是否与一个预设声纹信息匹配,若是,则获取该声纹信息的声源位置。5.如权利要求4所述的利用声源定位技术的音视频采集追踪方法,其特征在于,所述根据可疑人员的声源位置生成位置信息包括:以获取声纹信息的位置为原点建立球坐标系;提取所述声纹信息中的特征信息;获取声学传播模型;将所述特征信息输入至所述声学传播模型,从而获取声源位置在所述球坐标系中的位置信息。6.如权利要求5所述的利用声源定位技术的音视频采集追踪方法,其特征在于,所述利用声源定位技术的音视频采集追踪方法进一步包括:获取摄像系统朝向所述位置信息进行拍摄所获取的图像信息;识别所述图像信息,从而获取图像信息中的人脸信息;获取人脸数据库,所述人脸数据库包括至少一个预设人脸信息;判断所述人脸信息是否与一个所述预设人脸信息的相似度超过第一人脸相似度阈值,若是,则生成报警信息。7.如权利要求6所述的利用声源定...

【专利技术属性】
技术研发人员:杨晓东刘海东安俊峰何延华李罡刘新潘雷张统彪张和强李美景元广邵永佳张继伟孙戈王建军
申请(专利权)人:北京竞业达数码科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1