跨模态的目标检测方法、训练方法及相关设备技术

技术编号:44533499 阅读:20 留言:0更新日期:2025-03-07 13:23
本申请公开了一种跨模态的目标检测方法、训练方法及相关设备。该方法包括:获取待检测图像和描述文本;分别对待检测图像和描述文本进行特征提取,得到图像特征和文本特征;利用匹配分支对图像特征和文本特征进行匹配处理,得到目标的类别;以及,利用定位分支对图像特征进行定位处理,得到目标的定位图。上述方案,能够提高目标检测的准确度。

【技术实现步骤摘要】

本申请涉及目标检测,特别是涉及一种跨模态的目标检测方法、训练方法及相关设备


技术介绍

1、目标检测技术作为计算机视觉领域非常重要的任务之一,随着深度学习方法的快速发展,取得了快速的发展。

2、目前,可以采用跨模态的目标检测技术应用于目标检测任务。跨模态的目标检测任务主要是将多个不同模态信息联合起来,以进行目标检测任务。然而,将多个不同模态信息联合可能会影响任务的准确性,从而导致目标检测的准确度不高。


技术实现思路

1、本申请主要解决的技术问题是提供一种跨模态的目标检测方法、训练方法及相关设备,能够提高目标检测的准确度。

2、本申请第一方面提供了一种跨模态的目标检测方法,该方法包括:获取待检测图像和描述文本;分别对待检测图像和描述文本进行特征提取,得到图像特征和文本特征;利用匹配分支对图像特征和文本特征进行匹配处理,得到目标的类别;以及,利用定位分支对图像特征进行定位处理,得到目标的定位图。

3、本申请第二方面提供了一种目标检测模型的训练方法,目标检测模型至少包含匹配分支和本文档来自技高网...

【技术保护点】

1.一种跨模态的目标检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述利用定位分支对所述图像特征进行定位处理,得到目标的定位图,包括:

3.根据权利要求2所述的方法,其特征在于,所述利用所述第一定位图对所述过渡特征进行特征分离,得到分离特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述利用匹配分支对所述图像特征和所述文本特征进行匹配处理,得到目标的类别,包括:

5.一种目标检测模型的训练方法,其特征在于,目标检测模型至少包含匹配分支和定位分支,所述训练方法包括:

6.根据权利要求5所述的方法,...

【技术特征摘要】

1.一种跨模态的目标检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述利用定位分支对所述图像特征进行定位处理,得到目标的定位图,包括:

3.根据权利要求2所述的方法,其特征在于,所述利用所述第一定位图对所述过渡特征进行特征分离,得到分离特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述利用匹配分支对所述图像特征和所述文本特征进行匹配处理,得到目标的类别,包括:

5.一种目标检测模型的训练方法,其特征在于,目标检测模型至少包含匹配分支和定位分支,所述训练方法包括:

6.根据权利要求5所述的方法,其特征在于,所述利用定位分支对所述图像...

【专利技术属性】
技术研发人员:殷俊吴飞王科洋邵明
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1