System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于确定图像描述符的方法、编码流水线、以及视觉地点识别方法技术_技高网

用于确定图像描述符的方法、编码流水线、以及视觉地点识别方法技术

技术编号:40159684 阅读:6 留言:0更新日期:2024-01-26 23:34
为了改进视觉地点识别,提供了一种用于确定图像描述符(V(X))的计算机实施的方法。该方法包括以下步骤:a)通过为每个特征确定簇间权重(α)将来自特征图(18)的特征聚类成多个特征簇;b)针对步骤a)中获得的每个特征簇,确定簇内显著性权重(β)并分配给与所述特征簇相关联的每个特征;以及c)基于该簇间权重(α)和该簇内显著性权重(β)来确定该图像描述符(V(X))。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍


技术实现思路

【技术保护点】

1.一种用于确定用于视觉地点识别的图像描述符(V(X))的计算机实施的方法,该方法包括:

2.根据权利要求1所述的方法,其特征在于,在步骤a)中,通过卷积神经网络(22)从输入图像(20)中提取出要聚类的特征。

3.根据前述权利要求中任一项所述的方法,其特征在于,在步骤a)中,使用划分聚类方法、k均值聚类方法和/或软分配来对这些特征进行聚类。

4.根据前述权利要求中任一项所述的方法,其特征在于,在步骤b)中,将至少一个特征簇的沃罗诺伊单元分成由代表所述簇的代表性质心(cr)所代表的信息部分和由阴影质心(cs)所代表的至少一个不明确部分。

5.根据权利要求4所述的方法,其特征在于,该簇内显著性权重(β)被确定为使得该簇内显著性权重(β)指示特征位于该信息部分中的概率。

6.如权利要求4或5中任一项所述的方法,其特征在于,在步骤b)中,与被确定为位于该信息部分中的特征相比,被确定为位于该不明确部分中的特征被分配更低的簇内显著性权重(β)。

7.根据权利要求4至6中任一项所述的方法,其特征在于,在步骤b)中,针对每个特征簇,基于具有与该代表性质心(cr)最接近的欧几里德距离的该至少一个不明确部分中选择的至少一个最佳候选来初始化该至少一个阴影质心(cs)。

8.根据前述权利要求中任一项所述的方法,其特征在于,在步骤c)中,使用注意力金字塔池化模块(36)来突出信息部分的局部残差,并且通过具有至少一个金字塔级别的金字塔结构来将该特征图(18)分成多个多尺度区域,其中,该金字塔级别的至少一个区域特征(fkn,m)是通过在空间网格内聚合用该簇间权重(α)和该簇内显著性权重(β)加权后的显著的逐簇残差来确定的。

9.根据权利要求8所述的方法,其特征在于,每个区域特征(fkn,m)对每个特征簇的特征嵌入的贡献是根据相关的空间显著性值来确定的,该相关的空间显著性值是基于由配置为评估每个空间区域的独特性的卷积层计算的独特性值(μkn,m)来确定的。

10.根据权利要求9所述的方法,其特征在于,针对每个特征簇,通过聚合按相应的空间显著性值(μkn,m)加权后的这些区域特征(fkn,m),从该特征嵌入生成视觉词向量(Vk)。

11.根据权利要求10所述的方法,其特征在于,该图像描述符(V(X))是通过以下方式生成的:对每个特征簇的视觉词向量(Vk)进行归一化,用训练权重(γ)重新缩放每个归一化的视觉词向量,并连结这些重新缩放的归一化的视觉词向量以形成该图像描述符(V(X))。

12.一种用于从输入图像(20)确定图像描述符(V(X))的编码流水线(10),该编码流水线(10)包括被配置为执行根据前述权利要求中任一项所述的方法的步骤a)的特征提取模块(12)、被配置为执行该方法的步骤b)的局部细化模块(14)、以及被配置为执行该方法的步骤c)的全局整合模块(16)。

13.一种用于视觉地点识别的方法,该方法包括:

14.一种车辆,该车辆具有被配置用于记录场景的图像的图像传感器、和根据权利要求12所述的编码流水线(10)、和/或被配置为执行根据权利要求13所述的方法以便获得控制信号的视觉地点识别设备、以及被配置为处理该控制信号并执行由该控制信号指示的某动作的控制单元。

15.一种计算机程序、机器可读存储介质、或包括指令的数据信号,其在由数据处理设备执行时使得该设备执行根据前述权利要求1至11或13中任一项所述的方法的一个、一些或所有步骤。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于确定用于视觉地点识别的图像描述符(v(x))的计算机实施的方法,该方法包括:

2.根据权利要求1所述的方法,其特征在于,在步骤a)中,通过卷积神经网络(22)从输入图像(20)中提取出要聚类的特征。

3.根据前述权利要求中任一项所述的方法,其特征在于,在步骤a)中,使用划分聚类方法、k均值聚类方法和/或软分配来对这些特征进行聚类。

4.根据前述权利要求中任一项所述的方法,其特征在于,在步骤b)中,将至少一个特征簇的沃罗诺伊单元分成由代表所述簇的代表性质心(cr)所代表的信息部分和由阴影质心(cs)所代表的至少一个不明确部分。

5.根据权利要求4所述的方法,其特征在于,该簇内显著性权重(β)被确定为使得该簇内显著性权重(β)指示特征位于该信息部分中的概率。

6.如权利要求4或5中任一项所述的方法,其特征在于,在步骤b)中,与被确定为位于该信息部分中的特征相比,被确定为位于该不明确部分中的特征被分配更低的簇内显著性权重(β)。

7.根据权利要求4至6中任一项所述的方法,其特征在于,在步骤b)中,针对每个特征簇,基于具有与该代表性质心(cr)最接近的欧几里德距离的该至少一个不明确部分中选择的至少一个最佳候选来初始化该至少一个阴影质心(cs)。

8.根据前述权利要求中任一项所述的方法,其特征在于,在步骤c)中,使用注意力金字塔池化模块(36)来突出信息部分的局部残差,并且通过具有至少一个金字塔级别的金字塔结构来将该特征图(18)分成多个多尺度区域,其中,该金字塔级别的至少一个区域特征(fkn,m)是通过在空间网格内聚合用该簇间权重(α)和该簇内显著性权重(β)加权后的显著的逐簇残差来确定的。

【专利技术属性】
技术研发人员:彭国豪王郸维张俊李河山
申请(专利权)人:大陆汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1