目标检测模型的训练方法和装置制造方法及图纸

技术编号：41269721 阅读：23 留言：0更新日期：2024-05-11 09:24

本发明专利技术公开了一种目标检测模型的训练方法和装置，涉及自动驾驶技术领域。该方法的一具体实施方式包括：获取作为模型训练输入数据的视频信息，提取所述视频信息中连续帧的三维空间特征；其中，所述连续帧中包括作为尾帧的当前帧；将所述连续帧中除所述当前帧之外的其它图像的三维空间特征拼接为特定融合特征后输入待训练的目标检测模型，基于所述目标检测模型的输出结果与所述当前帧的标注真值数据获得第二类损失函数；基于第二类损失函数形成最终损失函数，利用所述最终损失函数训练所述目标检测模型。该实施方式能够提高目标检测模型的三维目标识别能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自动驾驶，尤其涉及一种目标检测模型的训练方法和装置。

技术介绍

1、在自动驾驶领域，需要实时识别目标物的三维信息以实现场景感知、控制和规划。在目前的纯视觉三维目标检测技术中，一般采用当前帧进行模型训练或者将一定数量的历史帧加入进行辅助训练，前一种方法无法利用连续帧图像在时序上的运动特征，后一种方法则过于倾向当前帧的信息而忽视历史帧信息，这是因为训练数据中的标注真值是对应于当前帧的，模型训练过程中会自然地倾向于当前帧，导致模型最终难以学习到历史帧中的丰富时序信息和运动信息，不利于模型性能的进一步提高。

技术实现思路

1、有鉴于此，本专利技术实施例提供一种目标检测模型的训练方法和装置，在模型训练过程中通过排除当前帧图像的损失函数构建过程来提高模型性能。

2、为实现上述目的，根据本专利技术的一个方面，提供了一种目标检测模型的训练方法。

3、本专利技术实施例的目标检测模型的训练方法包括：获取作为模型训练输入数据的视频信息，提取所述视频信息中连续帧的三维空间特征...

【技术保护点】

1.一种目标检测模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于第二类损失函数形成最终损失函数，包括：

3.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

4.根据权利要求1所述的方法，其特征在于，所述提取所述视频信息中连续帧的三维空间特征，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据每次抽取确定所述连续帧中序号等间隔排列的多帧图像，包括：

6.根据权利要求3所述的方法，其特征在于，所述多次抽取的序号间隔涵盖从2到第一数值之间的整数，第一数值为所述连续帧中图像数量的...

【技术特征摘要】

1.一种目标检测模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于第二类损失函数形成最终损失函数，包括：

3.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：

4.根据权利要求1所述的方法，其特征在于，所述提取所述视频信息中连续帧的三维空间特征，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据每次抽取确定所述连续帧中序号等间隔排列的多帧图像，包括：

6.根据权利要求3所述的方法，其特征在于，所述多次抽取的序号间隔涵盖从2到第一数值之间的整数，第一数值为所述连续帧中图像数量的一半。

7.根据权利要求3所述的方法，其特征在于，所述方法进一步包括：将所述连续帧中各图像的三维空间特征拼接为全量融合特征后输入所述目标检测模型，基于所述目标检测模型的输出结果与所述当前帧的标注真值数据获得第三类损失函数；以及，

...

【专利技术属性】
技术研发人员：姚卓坤，
申请(专利权)人：北京京东远升科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人