【技术实现步骤摘要】
本专利技术属于多模态自然图像检测领域,具体地说,涉及基于思维链条的图像级自动提示生成目标检测方法。
技术介绍
1、图像分类、目标检测和语义分割等视觉识别任务一直是计算机视觉研究中长期存在的问题,也是自动驾驶、遥感、机器人技术等众多计算机视觉应用的基础。随着深度学习的出现,视觉识别研究通过利用端到端可训练深度神经网络(dnn,deep neural networks)取得了巨大成功。然而,从传统机器学习向深度学习转变的过程中,又面临着从零开始训练dnn网络收敛速度缓慢以及收集大规模、特定任务和人工标记的训练数据难度大,这两大困难。
2、近年来,一种新的“预训练-微调-预测”学习范式逐渐兴起并在很多视觉识别任务中展现出很强的有效性。在这种新的范式下,首先使用某些现成的大规模数据对dnn模型进行预训练。这些数据有些带标注,有些不带标注。之后,再使用针对某特定任务的带标注训练数据对模型进行微调。因为在预训练阶段,模型已经学习到较全面的知识,所以根据这种范式可以加速网络收敛,并能更容易训练出针对各种下游任务性能良好的模型。
【技术保护点】
1.基于思维链条的图像级自动提示生成方法,其特征在于,利用思维链条思想将一阶段的目标检测任务分解为多步,针对特定数据集自动生成图像级的提示,从而提高目标检测准确率,包括以下步骤:
2.根据权利要求1所述的基于思维链条的图像级自动提示生成方法,其特征在于,所述的概念提取模块由前景物体提取器Extf和预训练好的文本-图像匹配对组成。
3.根据权利要求1所述的基于思维链条的图像级自动提示生成方法,其特征在于,所述的常识知识图谱GC以常识知识库概念网络为基础,待检测类别标签为实体,关联关系为边,关联程度为权重,数学模型为带权有向图。
4.根
...【技术特征摘要】
1.基于思维链条的图像级自动提示生成方法,其特征在于,利用思维链条思想将一阶段的目标检测任务分解为多步,针对特定数据集自动生成图像级的提示,从而提高目标检测准确率,包括以下步骤:
2.根据权利要求1所述的基于思维链条的图像级自动提示生成方法,其特征在于,所述的概念提取模块由前景物体提取器extf和预训练好的文本-图像匹配对组成。
3.根据权利要求1所述的基于思维链条的图像级自动提示生成方法,其特征在于,所述的常识知识图谱gc以常识知识库...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。