System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于变换器的对象检测制造技术_技高网

基于变换器的对象检测制造技术

技术编号:41418786 阅读:16 留言:0更新日期:2024-05-21 20:52
使用基于变换器的对象检测模型的对象检测包括随机初始化针对模型的基本查询值、基于输入图像的语义调制基本查询值、以及基于从多个输入图像提取的特征和调制后的查询值来训练模型。

【技术实现步骤摘要】

本文描述的实施例总体涉及计算机视觉上下文中的对象检测。


技术介绍

1、在广泛的计算机视觉技术下,对给定图像中的一个或多个感兴趣对象进行定位和分类。这些任务的基础是对象检测和对象分割。基于变换器的检测和分割模型使用对不同对象的基本查询值,实现了多阶段注意过程。因此,固定查询值用作输入图像内目标对象的位置和语义两者的全局先验。


技术实现思路

1、在一个示例实施例中,一种使用基于变换器的对象检测模型来检测对象的方法包括:基于基于变换器的对象检测模型的基本查询值来生成调制后的查询值;使用基本查询值和调制后的查询值来训练模型;利用调制后的查询值替换基本查询值以作为针对变换器解码器的输入,该变换器解码器将执行经训练的基于变换器的对象检测模型;以及将调制后的查询值和提取的图像特征输入到变换器解码器。

2、根据至少一个其他示例实施例,一种非易失性计算机可读介质,其在被执行时使至少一个处理器执行与对象检测相关的操作,所述操作包括:接收输入图像,基于输入图像的基本查询值和语义生成动态检测查询值,使用基本查询值和动态检测查询值来训练基于变换器的对象检测模型,以及使用经训练的基于变换器的对象检测模型基于动态检测查询值来执行对象检测。

3、根据至少一个其他示例实施例,基于变换器的对象检测器包括:特征提取模块;全局池化模块,用于使用来自特征提取模块的输出来计算组合系数;动态检测查询值生成器,用于将组合系数和针对基于变换器的对象检测模型的基本查询值的函数生成为动态检测查询值;以及变换器解码器,用于接收来自特征提取模块的输出和动态检测查询值以作为用于执行对象检测的输入。

本文档来自技高网...

【技术保护点】

1.一种使用基于变换器的对象检测模型来检测对象的方法,包括:

2.根据权利要求1所述的方法,其中所述调制后的查询值的生成包括:生成所述基本查询值的凸组合以产生所述调制后的查询值。

3.根据权利要求2所述的方法,其中所述凸组合的生成基于通过将提取的所述图像特征的全局特征输入到多层感知器MLP而生成的组合系数。

4.根据权利要求1所述的方法,其中提取的所述图像特征包括从输入图像提取的图像特征。

5.一种非易失性计算机可读介质,当被执行时,使至少一个处理器执行与对象检测相关的操作,所述操作包括:

6.根据权利要求5所述的非易失性计算机可读介质,其中所述动态检测查询值的生成包括:

7.根据权利要求6所述的非易失性计算机可读介质,其中所述计算基于从多个输入图像提取的特征。

8.根据权利要求5所述的非易失性计算机可读介质,其中使用经训练的所述基于变换器的对象检测模型来执行对象检测包括:利用所述调制后的查询值替换所述基本查询值。

9.根据权利要求5所述的非易失性计算机可读介质,其中所述对象检测的执行是由DETR变换器解码器来执行的。

10.根据权利要求5所述的非易失性计算机可读介质,其中所述至少一个处理器在与社交媒体平台相对应的服务器上执行。

11.根据权利要求5所述的非易失性计算机可读介质,其中所述至少一个处理器在智能设备上执行。

12.一种基于变换器的对象检测器,包括:

13.根据权利要求12所述的基于变换器的对象检测器,其中所述检测器执行DETR对象检测模型。

14.根据权利要求12所述的基于变换器的对象检测器,其中所述全局池化模块:

15.根据权利要求12所述的基于变换器的对象检测器,其中来自所述特征提取模块的所述输出包括从输入图像提取的特征。

16.根据权利要求14所述的基于变换器的对象检测器,其中所述动态检测查询值生成器通过执行所述组合系数和所述基本查询值的凸计算来生成所述动态检测查询值。

17.根据权利要求12所述的基于变换器的对象检测器,其中用于执行对象检测的所述输入不包括针对基于变换器的特征提取模块的所述基本查询值。

...

【技术特征摘要】

1.一种使用基于变换器的对象检测模型来检测对象的方法,包括:

2.根据权利要求1所述的方法,其中所述调制后的查询值的生成包括:生成所述基本查询值的凸组合以产生所述调制后的查询值。

3.根据权利要求2所述的方法,其中所述凸组合的生成基于通过将提取的所述图像特征的全局特征输入到多层感知器mlp而生成的组合系数。

4.根据权利要求1所述的方法,其中提取的所述图像特征包括从输入图像提取的图像特征。

5.一种非易失性计算机可读介质,当被执行时,使至少一个处理器执行与对象检测相关的操作,所述操作包括:

6.根据权利要求5所述的非易失性计算机可读介质,其中所述动态检测查询值的生成包括:

7.根据权利要求6所述的非易失性计算机可读介质,其中所述计算基于从多个输入图像提取的特征。

8.根据权利要求5所述的非易失性计算机可读介质,其中使用经训练的所述基于变换器的对象检测模型来执行对象检测包括:利用所述调制后的查询值替换所述基本查询值。

9.根据权利要求5所述的非易失性计算机可读介质,...

【专利技术属性】
技术研发人员:杨林杰崔一鸣俞海超
申请(专利权)人:脸萌有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1