一种视听觉模态传感器快速智能标定方法技术

技术编号:32030154 阅读:13 留言:0更新日期:2022-01-27 12:58
本发明专利技术公开了一种视听觉模态传感器快速智能标定方法,应用于传感器,所述方法包括:步骤1:获取目标对应的声源方位坐标集和图像中心点坐标集,其中,所述声源方位坐标集对应有声源坐标系,所述图像中心点坐标集对应有图像坐标系;步骤2:基于所述声源方位坐标集和图像中心点坐标集,计算所述声源坐标系与图像坐标系之间的目标映射参数,以实现传感器标定。本发明专利技术能够结合视觉模态和听觉模态,实现快速且精确地传感器标定。精确地传感器标定。精确地传感器标定。

【技术实现步骤摘要】
一种视听觉模态传感器快速智能标定方法


[0001]本专利技术属于人工智能
,具体涉及一种视听觉模态传感器快速智能标定方法。

技术介绍

[0002]随着信息技术的发展,对传感器标定也提出了越来越高的要求。
[0003]现有技术中,通常基于单模态进行传感器标定,如,基于视觉模态进行传感器标定,然而,基于单模态的传感器标定速度较低,标定需要的人力物力时间成本高。

技术实现思路

[0004]为了解决现有技术中存在的上述问题,本专利技术提供了一种视听觉模态传感器快速智能标定方法。本专利技术要解决的技术问题通过以下技术方案实现:
[0005]一种视听觉模态传感器快速智能标定方法,应用于传感器,所述方法包括:步骤1:获取目标对应的声源方位坐标集和图像中心点坐标集,其中,所述声源方位坐标集对应有声源坐标系,所述图像中心点坐标集对应有图像坐标系;步骤2:基于所述声源方位坐标集和图像中心点坐标集,计算所述声源坐标系与图像坐标系之间的目标映射参数,以实现传感器标定。
[0006]在本专利技术的一个实施例中,所述步骤1包括:步骤1

1:将第一次获取的声源方位坐标,表示为:P1(a1,b1),其中,a表示坐标系中第一方向上的坐标值,b表示坐标系中第二方向上的坐标值;将第一次获取的图像中心点坐标,表示为:P1'(a1',b1');步骤1

2:获取目标移动过程中的声源方位坐标集,表示为:(a1,b1)
T
,(a2,b2)
T
...,(a
i
,b
i
)
T
,...(a
n
,b
n
)
T
,其中,n表示坐标集中的坐标组总个数,i表示坐标组序数;获取目标移动过程中的图像中心点坐标集,表示为:(a1',b1')
T
,(a2',b2')
T
...,(a
i
',b
i
')
T
,...(a
n
',b
n
')
T

[0007]在本专利技术的一个实施例中,所述步骤2包括:步骤2

1:基于所述声源方位坐标集和图像中心点坐标集,计算所述声源坐标系和所述图像坐标系之间的旋转矩阵因子R;步骤2

2:基于所述旋转矩阵因子R,计算所述声源坐标系和所述图像坐标系之间的目标映射参数,以实现传感器标定。
[0008]本专利技术的有益效果:
[0009]本专利技术能够结合视觉模态和听觉模态,实现快速精确地传感器标定。
[0010]以下将结合附图及实施例对本专利技术做进一步详细说明。
附图说明
[0011]图1是本专利技术实施例提供的一种视听觉模态传感器快速智能标定方法流程示意图;
[0012]图2是本专利技术实施例提供的一种基于目标映射参数实现声源坐标系与图像坐标系变换的示意图。
具体实施方式
[0013]下面结合具体实施例对本专利技术做进一步详细的描述,但本专利技术的实施方式不限于此。
[0014]实施例
[0015]跨模态学习是当今人工智能和信息
一个重要研究课题,其进行联合特征学习和跨模态关系建模,旨在有效地利用不同模态内容的相关性进行系统性能优化。信息融合是指利用计算机技术对按时序获得的若干传感器的观测信息在一定准则下加以自动分析、综合处理,以完成所需的决策和估计任务而进行的信息处理过程。本专利技术基于跨模态学习,提出了一种视听觉跨模态技术,打破了以往传统的单一模态形式。
[0016]请参见图1,图1是本专利技术实施例提供的一种视听觉模态传感器快速智能标定方法流程示意图,应用于传感器,所述方法包括:
[0017]步骤1:获取目标对应的声源方位坐标集和图像中心点坐标集,其中,所述声源方位坐标集对应有声源坐标系,所述图像中心点坐标集对应有图像坐标系。
[0018]本专利技术能够通过声源定位技术获取可移动目标对应的声源方位坐标集,以及能够通过深度学习智能图像检测技术获得图像中心点坐标集。
[0019]需要说明的是,本专利技术对所述目标不做限制,所述目标可以是水平方向移动的物体,如,行走的人、行驶的车辆等,还可以是空间方向移动的物体,如,飞行设备等。
[0020]示例如,所述传感器配置有麦克风和摄像机,所述目标为人体,本专利技术通过麦克风获取人体水平行走过程中发出的语音,并获取声源方位坐标集,再通过摄像机拍摄人脸图像,通过智能人脸识别技术检测框,获取人脸图像的中心点坐标集。
[0021]所述声源坐标系和所述图像坐标系为二维坐标系。示例如,平面直角坐标系,则所述声源坐标系和所述图像坐标系中的第一方向为x轴方向,第二方向为y轴方向。
[0022]可选的,所述步骤1包括:
[0023]步骤1

1:将第一次获取的声源方位坐标,表示为:P1(a1,b1),其中,a表示坐标系中第一方向上的坐标值,b表示坐标系中第二方向上的坐标值;将第一次获取的图像中心点坐标,表示为:P1'(a1',b1')。
[0024]步骤1

2:获取目标移动过程中的声源方位坐标集,表示为:(a1,b1)
T
,(a2,b2)
T
...,(a
i
,b
i
)
T
,...(a
n
,b
n
)
T
,其中,n表示坐标集中的坐标组总个数,i表示坐标组序数;获取目标移动过程中的图像中心点坐标集,表示为:(a1',b1')
T
,(a2',b2')
T
...,(a
i
',b
i
')
T
,...(a
n
',b
n
')
T

[0025]步骤2:基于所述声源方位坐标集和图像中心点坐标集,计算所述声源坐标系与图像坐标系之间的目标映射参数,以实现传感器标定。
[0026]可选的,所述步骤2包括:
[0027]步骤2

1:基于所述声源方位坐标集和图像中心点坐标集,计算所述声源坐标系和所述图像坐标系之间的旋转矩阵因子R。
[0028]可选的,所述步骤2

1包括:
[0029]步骤2

11:将声源方位坐标集表示为:p1=(a1,b1)
T
,p2=(a2,b2)
T


p
i
=(a
i
,b
i
)
T


p
n
=(a
n
,b
n
)
T

[0030本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视听觉模态传感器快速智能标定方法,应用于传感器,其特征在于,所述方法包括:步骤1:获取目标对应的声源方位坐标集和图像中心点坐标集,其中,所述声源方位坐标集对应有声源坐标系,所述图像中心点坐标集对应有图像坐标系;步骤2:基于所述声源方位坐标集和图像中心点坐标集,计算所述声源坐标系与图像坐标系之间的目标映射参数,以实现传感器标定。2.根据权利要求1所述的方法,其特征在于,所述步骤1包括:步骤1

1:将第一次获取的声源方位坐标,表示为:P1(a1,b1),其中,a表示坐标系中第一方向上的坐标值,b表示坐标系中第二方向上的坐标值;将第一次获取的图像中心点坐标,表示为:P1'(a1',b1');步骤1

2:获取目标移动过程中的声源方位坐标集,表示为:(a1,b1)
T
,(a2,b2)
T
...,(a
i
,b
i
)
T
,...(a
n
,b
n
)
T
,其中,n表示坐标集中的坐标组总个数,i表示坐标组序数;获取目标移动过程中的图像中心点坐标集,表示为:(a1',b1')
T
,(a2',b2')
T
...,(a
i
',b
i
')
T
,...(a
n
',b
n
')
T
。3.根据权利要求2所述的方法,其特征在于,所述步骤2包括:步骤2

1:基于所述声源方位坐标集和图像中心点坐标集,计算所述声源坐标系和所述图像坐标系之间的旋转矩阵因子R;步骤2

2:基于所述旋转矩阵因子R,计算所述声源坐标系和所述图像坐标系之间的目标映射参数,以实现传感器标定。4.根据权利要求3所述的方法,其特征在于,所述步骤2

1包括:步骤2

11:将声源方位坐标集表示为:p1=(a1,b1)
T
,p2=(a2,b2)
T


p
i
=(a
i
,b
i
)
T


p
n
=(a
n
,b
n
)
T
;将图像中心点坐标集表示为:p1'=(a1',b1')
T
,p2'=(a2',b2')
T

,p
i
'=(a
i
',b
i
')
T
...

【专利技术属性】
技术研发人员:吴瑞晨闵海波孙磊华芷钒乔平安
申请(专利权)人:北京爱宾果科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1