【技术实现步骤摘要】
本专利技术属于机器学习,具体涉及一种无监督学习全局以物体为中心的表示物体识别方法及装置。
技术介绍
1、以物体为中心的无监督表示学习方法,旨在从复杂的视觉场景中解析出每个物体并在没有监督的情况下学习每个物体的表示。现有的研究工作在简单的合成场景中取得了良好的结果。这些方法通过组合多个由混合解码器生成的物体图像来重建场景图像。为了处理更复杂的场景,一些方法放弃使用混合解码器,而是采用自回归的transformer解码器,如slate,或扩散模型解码器,如lsd,来重建视觉场景。此类方法在场景图像重构损失基础上,增加了场景区域特征的重构损失,该损失可以为物体为中心的表示学习提供更强的监督信号,从而赋予模型能够处理复杂场景的能力。更进一步地,dinosaur使用预训练的transformer网络提取的特征作为自监督信息,学习以物体为中心的表示,使其能够有效处理更复杂的现实场景。
2、但是,现有的以物体为中心的无监督表示学习方法仅通过提取依赖于场景的、局部的以物体为中心的表示来发现当前场景中的物体,导致其缺乏像人类一样识别不同场景中
...【技术保护点】
1.一种无监督学习全局以物体为中心的表示物体识别装方法,用于得到场景图像中各个物体的身份预测结果,其特征在于,包括以下步骤:
2.根据权利要求1所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:
3.根据权利要求2所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:
4.根据权利要求3所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:
5.根据权利要求2所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:
6.根据权利要求5所述的无监督学习全局以物体
...【技术特征摘要】
1.一种无监督学习全局以物体为中心的表示物体识别装方法,用于得到场景图像中各个物体的身份预测结果,其特征在于,包括以下步骤:
2.根据权利要求1所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:
3.根据权利要求2所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:
4.根据权利要求3所述的无监督学习全局以物体为中心的表示物体识别装方法,其特征在于:
5.根据权利要求2所述的无监督学习全局...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。