当前位置: 首页 > 专利查询>复旦大学专利>正文

无监督学习全局以物体为中心的表示物体识别方法及装置制造方法及图纸

技术编号:43202216 阅读:33 留言:0更新日期:2024-11-01 20:20
本发明专利技术提供了一种无监督学习全局以物体为中心的表示物体识别方法及装置,具有这样的特征,包括以下步骤:步骤S1,根据现有图片数据构建训练数据集;步骤S2,构建预测训练模型;步骤S3,根据训练数据集对预测训练模型进行训练,得到训练好的预测训练模型;步骤S4,根据训练好的预测训练模型构建身份预测模型;步骤S5,将场景图像输入身份预测模型,得到身份预测结果。总之,本方法能够准确地识别场景图像中的物体。

【技术实现步骤摘要】

本专利技术属于机器学习,具体涉及一种无监督学习全局以物体为中心的表示物体识别方法及装置


技术介绍

1、以物体为中心的无监督表示学习方法,旨在从复杂的视觉场景中解析出每个物体并在没有监督的情况下学习每个物体的表示。现有的研究工作在简单的合成场景中取得了良好的结果。这些方法通过组合多个由混合解码器生成的物体图像来重建场景图像。为了处理更复杂的场景,一些方法放弃使用混合解码器,而是采用自回归的transformer解码器,如slate,或扩散模型解码器,如lsd,来重建视觉场景。此类方法在场景图像重构损失基础上,增加了场景区域特征的重构损失,该损失可以为物体为中心的表示学习提供更强的监督信号,从而赋予模型能够处理复杂场景的能力。更进一步地,dinosaur使用预训练的transformer网络提取的特征作为自监督信息,学习以物体为中心的表示,使其能够有效处理更复杂的现实场景。

2、但是,现有的以物体为中心的无监督表示学习方法仅通过提取依赖于场景的、局部的以物体为中心的表示来发现当前场景中的物体,导致其缺乏像人类一样识别不同场景中同类物体的能力。...

【技术保护点】

1.一种无监督学习全局以物体为中心的表示物体识别装方法,用于得到场景图像中各个物体的身份预测结果,其特征在于,包括以下步骤:

2.根据权利要求1所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:

3.根据权利要求2所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:

4.根据权利要求3所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:

5.根据权利要求2所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:

6.根据权利要求5所述的无监督学习全局以物体为中心的表示物体识别...

【技术特征摘要】

1.一种无监督学习全局以物体为中心的表示物体识别装方法,用于得到场景图像中各个物体的身份预测结果,其特征在于,包括以下步骤:

2.根据权利要求1所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:

3.根据权利要求2所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:

4.根据权利要求3所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:

5.根据权利要求2所述的无监督学习全局...

【专利技术属性】
技术研发人员:李斌陈同林薛向阳
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1