基于激光雷达和相机的动态交叉注意力人体姿态估算方法技术

技术编号:38826283 阅读:11 留言:0更新日期:2023-09-15 20:05
本发明专利技术提出了基于激光雷达和相机的动态交叉注意力人体姿态估算方法,所述方法包括如下步骤:对人体动作进行实时视频采集,并对视频帧进行预处理,将视频帧数据进行灰度化后滤波,随后进行边缘检测后将人体轮廓进行清晰标注;将预处理后的图像数据通过激光雷达获取图像数据中三维景深数据,对图像数据进行深度校正;获取激光雷达采集的特征量和相机采集的特征量数据;将激光雷达采集达特征量作为Q值,相机采集特征量作为K值输入交叉引导注意力网络中;对特征量进行整合,通过注意力机制的数据融合,将激光雷达采集特征量和相机采集特征量进行组合,对图像数据中的人体骨骼进行估算定位。位。位。

【技术实现步骤摘要】
基于激光雷达和相机的动态交叉注意力人体姿态估算方法


[0001]本专利技术属于机器学习领域,特别涉及基于激光雷达和相机的动态交叉注意力人体姿态估算方法。

技术介绍

[0002]激光雷达是一种测量三维距离信息的传感器,可以实时测量目标的距离并生成图像数据。动态交叉注意力人体姿态估算方法使用激光雷达数据作为输入,通过训练网络提取目标的几何特征,并根据图像数据重建目标的三维模型,从而实现动态交叉注意力人体姿态估算。相机数据。相机数据也是一种常见的人体姿态估算数据,特别是在视频通话和虚拟现实等应用中。动态交叉注意力人体姿态估算方法需要先将相机数据与激光雷达数据进行整合,然后提取目标的几何特征,并通过训练网络实现目标的几何建模,从而实现动态交叉注意力人体姿态估算。
[0003]人体姿态估算是计算机视觉的一个重要领域,主要用于估计人体的三维姿态和运动,以及应用于运动监控、虚拟现实等领域。传统的人体姿态估算方法通常需要依赖于传感器如激光雷达、相机等,但是这些传感器存在着限制,如激光雷达只能测量三维距离信息,而相机只能拍摄二维图像。因此,传统的人体姿态估算方法通常存在着精度低、适应性差等问题。动态交叉注意力人体姿态估算方法是近年来提出的一种新型的人体姿态估算方法,它将激光雷达数据、相机数据整合到一起,通过训练网络来提取目标的几何特征,并通过重建目标的三维模型来实现动态交叉注意力人体姿态估算。除了激光雷达和相机数据外,动态交叉注意力人体姿态估算方法还可以利用其他相机数据,如正面、侧面、背面等相机数据。这些相机数据可以提供丰富的人体姿态信息,有助于提高动态交叉注意力人体姿态估算方法的精度和适应性。在实际应用中,动态交叉注意力人体姿态估算方法可以用于实时捕捉人体动作的视频或者图像,从而实时计算出人体的动态姿态和运动。此外,该方法还可以应用于游戏、电影、医学等领域,为相关领域的研究和应用提供了新的思路和方向。
[0004]因此,现在亟需基于激光雷达和相机的动态交叉注意力人体姿态估算方法。

技术实现思路

[0005]本专利技术提出基于激光雷达和相机的动态交叉注意力人体姿态估算方法,解决了现有技术中没有一套方式进行动态交叉注意力网络对目标进行有效的特征提取,也没有实现动态交叉注意力人体姿态估算模型的重建的问题。
[0006]本专利技术的技术方案是这样实现的:基于激光雷达和相机的动态交叉注意力人体姿态估算方法,所述方法包括如下步骤:
[0007]对人体动作进行实时视频采集,并对视频帧进行预处理,将视频帧数据进行灰度化后滤波,随后进行边缘检测后将人体轮廓进行清晰标注;
[0008]将预处理后的图像数据通过激光雷达获取图像数据中三维景深数据,对图像数据进行深度校正;
[0009]获取激光雷达采集的特征量和相机采集的特征量数据;将激光雷达采集达特征量作为Q值,相机采集特征量作为K值输入交叉引导注意力网络中;
[0010]对特征量进行整合,通过注意力机制的数据融合,将激光雷达采集特征量和相机采集特征量进行组合,对图像数据中的人体骨骼进行估算定位;
[0011]将若干个进行特征量整合的视频帧进行重组,获取人体动态移动轨迹,并根据移动轨迹估算运动模糊状态,对视频帧间的动态模糊进行去除;
[0012]将重组的所有视频帧的交叉注意力网络进行调用,获取人体姿态变动轨迹,对人体骨骼位置、姿态、运动状态进行汇总。
[0013]目前如何实现动态交叉注意力网络对目标进行有效的特征提取是行业困扰问题。传统的动态交叉注意力网络通常采用随机游走的方式来生成注意力向量,而这种方式往往会导致向量之间的重叠和干扰,从而影响网络的学习效果。而基于激光雷达和相机的动态交叉注意力人体姿态估算方法则采用了更加高效的交叉引导注意力机制,将激光雷达和相机数据进行整合,并与传统的随机游走方式进行结合,从而更好地实现目标的特征提取。如何实现动态交叉注意力人体姿态估算模型的重建。传统的动态交叉注意力人体姿态估算方法通常采用线性插值的方式来重建目标的三维模型,但是这种方式可能会导致重建模型的精度和稳定性下降。而基于激光雷达和相机的动态交叉注意力人体姿态估算方法则采用了更加高效的三维卷积神经网络来重建目标的三维模型,并结合了动态交叉引导注意力机制对重建模型进行优化。
[0014]作为一优选的实施方式,所述视频帧进行灰度化时,首先将视频帧数据转换为灰度值,将每一像素点的值都对应到固定的灰度数值上,对每一灰度值进行比较,如果大于某个阈值,则保留该像素点,否则将该像素点从序列数据中去除。将视频帧数据转换为灰度值,将每一像素点的值都对应到固定的灰度数值上,并对每一灰度值进行比较,如果大于某个阈值,则保留该像素点,否则将该像素点从序列数据中去除。这个过程叫做灰度化。灰度化可以使视频帧数据中的每一个像素点都对应到相同的灰度数值上,这样可以更方便地对每个像素点进行处理和分析。如果灰度数值大于某个阈值,则保留的像素点数量就会增加,否则就会将该像素点从序列数据中去除。这是一种常见的视频帧灰度化方法,可以使视频帧数据更易于处理和分析。
[0015]作为一优选的实施方式,在完成灰度化后进行滤波,使用滤波器对灰度化后的数据进行滤波,通过不同的滤波器对滤波器参数进行设置,以处理不同类型的数据。在完成灰度化后,可以使用滤波器对灰度化后的数据进行滤波,以处理不同类型的数据。滤波器是一种计算机程序,可以对图像或视频进行处理和分析,以提取出有用的信息和特征。通过不同的滤波器对滤波器参数进行设置,可以处理不同类型的数据,比如平滑曲线、保留细节、抑制噪声等。通过滤波器,可以将复杂的数据信号过滤掉,留下有用的信息和特征,从而提高数据的处理效率和准确性。
[0016]作为一优选的实施方式,所述滤波器采用均值滤波、中值滤波和滑动中值滤波中任意一种滤波方式进行滤波处理。
[0017]作为一优选的实施方式,在进行深度校正时,首先构建图像数据空间分层,在空间分层内对图像数据的深度进行校正,将图像数据内的景深图像填充至对应图层内。这个过程需要首先确定图像数据的分层,然后对图像数据进行深度校正,以确保图像数据与实际
深度之间的一致性。最后,将处理后的图像数据填充至对应图层内,以使其符合实际应用需求。
[0018]作为一优选的实施方式,在将激光雷达采集的特征量作为Q值,将相机采集的特征量作为K值输入交叉引导注意力网络中,然后对交叉引导注意力网络进行训练,以获取到每个点的Q值和K值,并将这些值存放在数据库中,等待数据整合。将激光雷达采集的特征量作为Q值,将相机采集的特征量作为K值,输入交叉引导注意力网络中。首先,通过激光雷达和相机数据采集得到目标的三维信息,然后将这些信息融合到一起,形成一个完整的目标数据集。接着,将这个数据集输入到交叉引导注意力网络中进行训练,以获取到每个点的Q值和K值。最后,将这些值存放在数据库中,等待数据整合。这是一个先将激光雷达和相机数据融合,再输入交叉引导注意力网络进行训练的过程。这样可以充分利用激光雷达和相机数据的优势,提高网络的性能。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于激光雷达和相机的动态交叉注意力人体姿态估算方法,其特征在于,所述方法包括如下步骤:对人体动作进行实时视频采集,并对视频帧进行预处理,将视频帧数据进行灰度化后滤波,随后进行边缘检测后将人体轮廓进行清晰标注;将预处理后的图像数据通过激光雷达获取图像数据中三维景深数据,对图像数据进行深度校正;获取激光雷达采集的特征量和相机采集的特征量数据;将激光雷达采集达特征量作为Q值,相机采集特征量作为K值输入交叉引导注意力网络中;对特征量进行整合,通过注意力机制的数据融合,将激光雷达采集特征量和相机采集特征量进行组合,对图像数据中的人体骨骼进行估算定位;将若干个进行特征量整合的视频帧进行重组,获取人体动态移动轨迹,并根据移动轨迹估算运动模糊状态,对视频帧间的动态模糊进行去除;将重组的所有视频帧的交叉注意力网络进行调用,获取人体姿态变动轨迹,对人体骨骼位置、姿态、运动状态进行汇总。2.如权利要求1所述的基于激光雷达和相机的动态交叉注意力人体姿态估算方法,其特征在于:所述视频帧进行灰度化时,首先将视频帧数据转换为灰度值,将每一像素点的值都对应到固定的灰度数值上,对每一灰度值进行比较,如果大于某个阈值,则保留该像素点,否则将该像素点从序列数据中去除。3.如权利要求2所...

【专利技术属性】
技术研发人员:蔡通尹子鳗余杭钱骁
申请(专利权)人:北京新清泰克科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1