【技术实现步骤摘要】
【国外来华专利技术】物体姿态的检测方法、装置、计算机设备和存储介质
[0001]本申请实施例涉及计算机视觉的
,例如涉及一种物体姿态的检测方法、装置、计算机设备和存储介质。
技术介绍
[0002]在短视频、直播、自动驾驶、AR(Augmented Reality,增强现实)、机器人等业务场景中,通常会进行3D(3
‑
dimension,三维)目标检测,及对作为目标的物体检测物体在三维空间的信息,进行添加特效、路线规划、运动轨迹规划等业务处理。
技术实现思路
[0003]本申请实施例提出了一种物体姿态的检测方法、装置、计算机设备和存储介质。
[0004]第一方面,本申请实施例提供了一种物体姿态的检测方法,包括:
[0005]获取图像数据,所述图像数据中具有目标物体;
[0006]将所述图像数据输入二维检测模型中,检测三维的边界框投影至所述图像数据时的二维的第一姿态信息,所述边界框用于检测所述目标物体;
[0007]将所述第一姿态信息映射为三维的第二姿态信息;
[0008]根据所述第二姿态信息检测所述目标物体的第三姿态信息。
[0009]第二方面,本申请实施例还提供了一种物体姿态的检测装置,包括:
[0010]图像数据获取模块,设置为获取图像数据,所述图像数据中具有目标物体;
[0011]第一姿态信息检测模块,设置为将所述图像数据输入二维检测模型中,检测三维的边界框投影至所述图像数据时的二维的第一姿态信息,所述边界框用于检测所述目标物体; ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种物体姿态的检测方法,包括:获取图像数据,所述图像数据中具有目标物体;将所述图像数据输入二维检测模型中,检测三维的边界框投影至所述图像数据时的二维的第一姿态信息,所述边界框用于检测所述目标物体;将所述第一姿态信息映射为三维的第二姿态信息;根据所述第二姿态信息检测所述目标物体的第三姿态信息。2.根据权利要求1所述的方法,其中,所述二维检测模型包括编码器、解码器、预测网络;所述将所述图像数据输入二维检测模型中,检测边界框的二维的第一姿态信息,包括:在所述编码器中对所述图像数据进行编码,获得第一图像特征;在所述解码器中对所述第一图像特征进行解码,获得第二图像特征;在所述预测网络中将所述第二图像特征映射为边界框的二维的第一姿态信息。3.根据权利要求2所述的方法,其中,所述编码器包括卷积层、第一残差网络、第二残差网络、第三残差网络、第四残差网络、第五残差网络,所述第一残差网络、所述第二残差网络、所述第三残差网络、所述第四残差网络与所述第五残差网络分别包括至少一个瓶颈残差块;所述在所述编码器中对所述图像数据进行编码,获得第一图像特征,包括:在所述卷积层中对所述图像数据进行卷积处理,获得第一层级特征;在所述第一残差网络中对所述第一层级特征进行处理,获得第二层级特征;在所述第二残差网络中对所述第二层级特征进行处理,获得第三层级特征;在所述第三残差网络中对所述第三层级特征进行处理,获得第四层级特征;在所述第四残差网络中对所述第四层级特征进行处理,获得第五层级特征;在所述第五残差网络中对所述第五层级特征进行处理,获得第六层级特征。4.根据权利要求3所述的方法,其中,所述第一残差网络中所述瓶颈残差块的数量小于所述第二残差网络中所述瓶颈残差块的数量,所述第二残差网络中所述瓶颈残差块的数量小于所述第三残差网络中所述瓶颈残差块的数量,所述第三残差网络中所述瓶颈残差块的数量小于所述第四残差网络中所述瓶颈残差块的数量,所述第四残差网络中所述瓶颈残差块的数量等于所述第五残差网络中所述瓶颈残差块的数量;所述第二层级特征的维度高于所述第三层级特征的维度,所述第三层级特征的维度高于所述第四层级特征的维度,所述第四层级特征的维度高于所述第五层级特征的维度,所述第五层级特征的维度高于所述第六层级特征的维度。5.根据权利要求3所述的方法,其中,所述解码器包括转置卷积层、第六残差网络,所述第六残差网络包括多个瓶颈残差块;所述在所述解码器中对所述第一图像特征进行解码,获得第二图像特征,包括:在所述转置卷积层中对所述第六层级特征数据进行卷积处理,获得第七层级特征;将所述第五层级特征与所述第七层级特征拼接为第八层级特征;在所述第六残差网络中对所述第八层级特征进行处理,获得第二图像特征。6.根据权利要求5所述的方法,其中,所述第二图像特征的维度高于所述第六层级特征的维度。
7.根据权利要求5所述的方法,其中,所述预测网络包括第一预测网络、第二预测网络、第三预测网络、第四预测网络,所述第一预测网络、所述第二预测网络、所述第三预测网络与所述第四预测网络分别包括多个瓶颈残差块;所述在所述预测网络中将所述第二图像特征映射为边界框的二维的第一姿态信息,包括:在所述第一预测网络中对所述第二图像特征进行处理,获得边界框的中心点;在所述第二预测网络中对所述第二图像特征进行处理,获得边界框的深度;在所述第三预测网络中对所述第二图像特征进行处理,获得边界框的尺寸;在所述第四预测网络中对所述第二图像特征进行处理,获得边界框中的顶点相对于所述中心点偏移的距离。8.根据权利要求1所述的方法,其中,所述二维检测模型包括目标检测模型与编码模型,目标检测模型与编码模型级联;所述将所述图像数据输入二维检测模型中,检测边界框的二维的第一姿态信息,包括:在所述目标检测模型...
【专利技术属性】
技术研发人员:井雪,陈德健,陈建强,蔡佳然,项伟,
申请(专利权)人:百果园技术新加坡有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。