【技术实现步骤摘要】
本专利技术涉及文本信息引导的目标检测领域,具体提出了一种通过分别提取视觉与语言模态输入中的关键信息,引入多模态预训练模型能力,进行模态间原型匹配的文本信息目标检测方法。整个系统采用视觉-语言预训练模型的图像文本编码器对输入图片与文本信息进行编码,将不同模态的信息映射到同一向量空间,采用复杂输入中的关键信息进行原型匹配,使模型拥有自进化的精准的目标检测能力。
技术介绍
1、文本信息引导的目标检测任务是一项多模态领域的关键技术,任务与多模态视觉语言检索领域的重识别任务类似,旨在在一张给定图片中,根据文本信息,找到到图片中符合描述的目标,具体来说,任务的输入为描述目标形态,特征的文本以及一张场景复杂,包含许多对象的图片,模型将根据文本信息,在图像中进行目标检测,找到符合文本描述的目标对象并输出其在图像中的位置坐标。要求能够全面理解复杂的语言语义信息和视觉场景信息,并对文本语义和各种图片中各种目标对象的相关性进行挖掘。可以适用于非常多的现实任务场景中,不仅可以用于监控、安防等现阶段的应用场景,也可以部署在机器人中,用于民用(陪护、医疗)、军用(
...【技术保护点】
1.一种基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于包括下述步骤:
2.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
3.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
4.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
5.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
6.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
...【技术特征摘要】
1.一种基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于包括下述步骤:
2.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
3.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
4.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
5.根据权利要求1所述的基于原型匹配的文本信息引导的自进化目标检测方法,其特征在于:
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。