System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于超图关联建模的视觉对象检测方法及装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>清华大学专利>正文

基于超图关联建模的视觉对象检测方法及装置制造方法及图纸

技术编号:40073302 阅读:10 留言:0更新日期:2024-01-17 00:30
本申请涉及一种基于超图关联建模的视觉对象检测方法及装置,其中,方法包括:从输入图像中,提取可能存在物体的检测框;根据可能存在物体的检测框的物理位置近邻关系和特征近邻关系分别构造超图建模物体感兴趣区域ROI框之间的高阶关联;基于高阶关联和基于超图关联的特征平滑损失函数,对模型进行训练调优,得到视觉对象检测模型,以输出视觉对象检测结果。由此,解决了相关技术中,无法联系目标与周围环境与其他目标之间的语义信息和空间关系,导致目标检测的准确性低,对于遮挡、复杂场景等情况下的鲁棒性差,不能够与其他目标检测算法进行结合,可扩展性差等问题。

【技术实现步骤摘要】

本申请涉及视觉对象检测,特别涉及一种基于超图关联建模的视觉对象检测方法及装置


技术介绍

1、目标检测是计算机视觉领域的一个重要任务,其目标是在图像或视频中准确地识别和定位特定目标。然而,传统的目标检测算法在处理复杂场景、遮挡、尺度变化等问题时存在一定的局限性。为了克服这些问题,引入了超图的概念来增强目标检测算法。

2、相关技术中,主要基于边界框的检测和分类,考虑单个目标的特征,

3、然而,相关技术中,无法联系目标与周围环境与其他目标之间的语义信息和空间关系,导致目标检测的准确性低,对于遮挡、复杂场景等情况下的鲁棒性差,不能够与其他目标检测算法进行结合,可扩展性差,亟待改进。


技术实现思路

1、本申请提供一种基于超图关联建模的视觉对象检测方法及装置,以解决相关技术中,无法联系目标与周围环境与其他目标之间的语义信息和空间关系,导致目标检测的准确性低,对于遮挡、复杂场景等情况下的鲁棒性差,不能够与其他目标检测算法进行结合,可扩展性差等问题。

2、本申请第一方面实施例提供一种基于超图关联建模的视觉对象检测方法,包括以下步骤:从输入图像中,提取可能存在物体的检测框;根据所述可能存在物体的检测框的物理位置近邻关系和特征近邻关系分别构造超图建模物体感兴趣区域roi框之间的高阶关联;以及基于所述高阶关联和基于超图关联的特征平滑损失函数,对模型进行训练调优,得到视觉对象检测模型,以输出视觉对象检测结果。

3、可选地,在本申请的一个实施例中,在提取所述可能存在物体的检测框之前,还包括:对原始图像进行去噪和尺度归一化处理,得到所述输入图像。

4、可选地,在本申请的一个实施例中,所述根据所述可能存在物体的检测框的物理位置近邻关系和特征近邻关系分别构造超图建模物体感兴趣区域roi框之间的高阶关联,包括:根据空间关联构建第一超图结构;根据特征关联构建第二超图结构;通过超图卷积对所述第一超图结构、所述第二超图结果和roi特征进行融合表示,得到所述高阶关联。

5、可选地,在本申请的一个实施例中,所述超图卷积的卷积公式为:

6、

7、其中,x(l)表示第l层超图的信号,σ(·)表示非线性激活函数,dv表示超图的节点度数对角矩阵,h表示关联矩阵,w表示超边权重构建的对角矩阵,de表示超图的超边权重对角矩阵,θ(l)表示第l层超图的滤波器矩阵。

8、可选地,在本申请的一个实施例中,所述特征平滑损失函数为:

9、

10、其中,代表第i个样本在二次分类的时候对第c个类别的置信度,p代表一次分类的类别预测值,p*代表二次分类的类别预测值,yic代表第i个样本是否属于第c个类别的二值指示函数。

11、本申请第二方面实施例提供一种基于超图关联建模的视觉对象检测装置,包括:提取模块,用于从输入图像中,提取可能存在物体的检测框;构造模块,用于根据所述可能存在物体的检测框的物理位置近邻关系和特征近邻关系分别构造超图建模物体感兴趣区域roi框之间的高阶关联;以及输出模块,用于基于所述高阶关联和基于超图关联的特征平滑损失函数,对模型进行训练调优,得到视觉对象检测模型,以输出视觉对象检测结果。

12、可选地,在本申请的一个实施例中,还包括:预处理模块,用于对原始图像进行去噪和尺度归一化处理,得到所述输入图像。

13、可选地,在本申请的一个实施例中,所述构造模块包括:第一构建单元,用于根据空间关联构建第一超图结构;第二构建单元,用于根据特征关联构建第二超图结构;融合单元,用于通过超图卷积对所述第一超图结构、所述第二超图结果和roi特征进行融合表示,得到所述高阶关联。

14、可选地,在本申请的一个实施例中,超图卷积的卷积公式为:

15、

16、其中,x(l)表示第l层超图的信号,σ(·)表示非线性激活函数,dv表示超图的节点度数对角矩阵,h表示关联矩阵,w表示超边权重构造的对角矩阵,de表示超图的超边权重对角矩阵,θ(l)表示第l层超图的滤波器矩阵。

17、可选地,在本申请的一个实施例中,所述特征平滑损失函数为:

18、

19、其中,代表第i个样本在二次分类的时候对第c个类别的置信度,p代表一次分类的类别预测值,p*代表二次分类的类别预测值,yic代表第i个样本是否属于第c个类别的二值指示函数。

20、本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于超图关联建模的视觉对象检测方法。

21、本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,该程序被处理器执行时实现如上的基于超图关联建模的视觉对象检测方法。

22、本申请实施例可以将超图关联建模与学习引入目标检测任务,从而关联目标与周围环境和其他目标之间的语义信息和空间关系,提高目标检测的准确性,使得算法对于遮挡、复杂场景等情况具有更好的鲁棒性,能够灵活地适应不同的目标检测任务和场景,可扩展性强。由此,解决了相关技术中,无法联系目标与周围环境与其他目标之间的语义信息和空间关系,导致目标检测的准确性低,对于遮挡、复杂场景等情况下的鲁棒性差,不能够与其他目标检测算法进行结合,可扩展性差等问题。

23、本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

本文档来自技高网...

【技术保护点】

1.一种基于超图关联建模的视觉对象检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,在提取所述可能存在物体的检测框之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述可能存在物体的检测框的物理位置近邻关系和特征近邻关系分别构造超图建模物体感兴趣区域ROI框之间的高阶关联,包括:

4.根据权利要求3所述的方法,其特征在于,所述超图卷积的卷积公式为:

5.根据权利要求1所述的方法,其特征在于,所述特征平滑损失函数为:

6.一种基于超图关联建模的视觉对象检测装置,其特征在于,包括:

7.根据权利要求6所述的装置,其特征在于,还包括:

8.根据权利要求6所述的装置,其特征在于,所述构造模块包括:

9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-5任一项所述的基于超图关联建模的视觉对象检测方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-5任一项所述的基于超图关联建模的视觉对象检测方法。

...

【技术特征摘要】

1.一种基于超图关联建模的视觉对象检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,在提取所述可能存在物体的检测框之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述可能存在物体的检测框的物理位置近邻关系和特征近邻关系分别构造超图建模物体感兴趣区域roi框之间的高阶关联,包括:

4.根据权利要求3所述的方法,其特征在于,所述超图卷积的卷积公式为:

5.根据权利要求1所述的方法,其特征在于,所述特征平滑损失函数为:

6.一种基于超图关联建模的视觉...

【专利技术属性】
技术研发人员:高跃丰一帆
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1