训练目标检测模型和检测目标的方法技术

技术编号：30020876 阅读：19 留言：0更新日期：2021-09-11 06:41

本公开提供了训练目标检测模型和检测目标的方法及装置，涉及人工智能领域，具体涉及计算机视觉和深度学习技术，具体可用于智能交通场景下。具体实现方案为：获取样本集，其中，样本集中的样本包括图片和标注信息，标注信息包括目标招牌的位置信息、深度值、方向角。执行以下训练步骤：从样本集中选取样本输入目标检测模型的关键点检测层，输出位置预测结果。基于位置预测结果生成候选区域。将候选区域输入目标检测模型的预测层，得到预测方向角、分类回归结果和预测深度。基于所选取的样本的标注信息与预测方向角、分类回归结果和预测深度训练目标检测模型。该实施方式生成了可以同时检测深度和位置的目标检测模型，提高了模型识别准确率。准确率。准确率。

全部详细技术资料下载

【技术实现步骤摘要】
训练目标检测模型和检测目标的方法

[0001]本公开涉及人工智能领域，具体涉及计算机视觉和深度学习技术，具体可用于智能交通场景下。

技术介绍

[0002]POI(point of interest,兴趣点)对于地图位置检索、地图导航定位等方向有着重要意义，更是本地生活业务的基本支撑。传统的POI采集方式依赖于人工作业，不仅效率低下，而且成本高昂。为实现“降本增效，实时更新”的目标，车载影像将成为POI自动化更新的主要数据源。
[0003]众所周知，深度学习本质上是一门数据科学，模型的输出与输入数据的质量息息相关，模型的泛化性能与输入数据的数量息息相关。事实上，由于现实世界的复杂性，商铺招牌往往也是多种多样，由于标注成本的限制，不可能让模型见过每一种类型的招牌，因此，在较少的精标注样本中学习到鲁棒性较强的可用于生产的模型难度较大。另一方面，由于图像是将三维世界映射到二维平面成像，因此缺少相应的深度信息，而POI的深度信息对于建设该POI的高精坐标十分重要，因此，通过技术手段从单目图像中恢复出招牌区域的深度信息也是一个难点。

技术实现思路

[0004]本公开提供了一种训练目标检测模型和检测目标的方法、装置、设备、存储介质以及计算机程序产品。
[0005]根据本公开的第一方面，提供了一种训练目标检测模型的方法，包括：获取样本集，其中，样本集中的样本包括图片和标注信息，标注信息包括目标招牌的位置信息、深度值、方向角；执行以下训练步骤：从所述样本集中选取样本输入目标检测模型的关键点检测层，输出位...

【技术保护点】

【技术特征摘要】
1.一种训练目标检测模型的方法，包括：获取样本集，其中，样本集中的样本包括图片和标注信息，标注信息包括目标招牌的位置信息、深度值、方向角；执行以下训练步骤：从所述样本集中选取样本输入目标检测模型的关键点检测层，输出位置预测结果，其中，所述位置预测结果包括角点与中心点热力图、中心点偏移、基于中心点的目标宽高；基于所述位置预测结果生成候选区域；将所述候选区域输入目标检测模型的预测层，得到预测方向角、分类回归结果和预测深度；基于所选取的样本的标注信息与所述预测方向角、所述分类回归结果和所述预测深度计算总损失值；若所述总损失值小于目标值，则确定出所述目标检测模型训练完成。2.根据权利要求1所述的方法，其中，所述方法还包括：若总损失值大于等于目标值，则调整所述目标检测模型的相关参数，并基于调整后的目标检测模型继续执行上述训练步骤。3.根据权利要求1所述的方法，其中，所述基于所选取的样本的标注信息与所述预测方向角、所述分类回归结果和所述预测深度计算总损失值，包括：若目标招牌的数量小于预定值，则获取所选取的样本的深度监督信号和分类回归监督信号；基于所述深度监督信号、所述分类回归监督信号对所选取的样本的标注信息进行补充；基于所选取的样本的补充后的标注信息与预测方向角、分类回归结果和预测深度计算总损失值。4.根据权利要求3所述的方法，其中，所述获取所选取的样本的深度监督信号和分类回归监督信号，包括：将所述候选区域和选取的样本输入预先训练的深度估计模型，输出所述候选区域的深度预测信息作为深度监督信号；将选取的样本输入预先训练的目标检测器，输出检测框的位置信息作为分类回归监督信号。5.根据权利要求4所述的方法，其中，所述输出检测框的位置信息作为分类回归监督信号，包括：获取每个检测框的位置信息的置信度；按置信度由大到小的顺序选取预定数目个置信度大于预定置信度阈值的检测框的位置信息作为分类回归监督信号。6.根据权利要求5所述的方法，其中，所述基于所选取的样本的标注信息与所述预测方向角、所述分类回归结果和所述预测深度计算总损失值，包括：为所述分类回归结果设置与补充后的标注信息中的置信度成正比的损失权重；基于所述损失权重、补充后的标注信息与所述预测方向角、所述分类回归结果和所述预测深度计算总损失值。7.根据权利要求5所述的方法，其中，所述角点与中心点热力图的高斯峰值为每个检测框的位置信息的置信度。8.一种检测目标的方法，包括：
获取待检测区域的街景图；将所述街景图输入根据权利要求1
‑
7中任一项所述的方法训练出的目标检测模型，输出所述街景图中至少一个招牌的方向角、位置信息和深度信息。9.根据权利要求8所述的方法，其中，所述位置信息包括中心点位置、基于中心点的目标宽高、四个角的位置；所述方法还包括：对于所述至少一个招牌中每个招牌，基于该招牌的中心点位置和基于中心点的目标宽高进行回归得到预测框，若该招牌的四个角的位置在所述预测框的内部，则保留该招牌，否则过滤掉。10.根据权利要求9所述的方法，其中，所述方法还包括：对于所述至少一个招牌中每个招牌，基于该招牌的方向角、中心点深度、中心点位置、四个角的位置分别计算每个角的深度并输出。11.一种训练目标检测模型的装置，包括：获取单元，被配置成获取样本集，其中，样本集中的样本包括图片和标注信息，标注信息包括目标招牌的位置信息、深度值、方向角；训练单元，被配置成执行以下训练步骤：从所述样本集中选取样本输入目标检测模型的关键点检测层，输出位置预测结果，其中，所...

【专利技术属性】
技术研发人员：董青，王洪志，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人