一种无监督学习物体外观的算法制造技术

技术编号：25044068 阅读：31 留言：0更新日期：2020-07-29 05:34

本发明专利技术公开了一种无监督学习物体外观的算法，涉及学习物体外观领域，要解决的是没有显式的学会该类物体的具体边界以及分割掩模的问题。本发明专利技术步骤如下：步骤一，准备一张包含充分多目标类别物体的图片；步骤二，对步骤一的图片进行数据预处理；步骤三，对步骤二的图片使用生成对抗网络训练学习前景外观和分割掩模。本发明专利技术只用到了一张密集同类物体随机堆积的图片,利用了其中包含的丰富的该类别物体的外观信息，生成四通道图片进而合成多物体堆叠图像,通过对抗训练优化合成图像的真实程度,从而优化每个图层学习到的外观,惩罚每个图层分割掩模的面积,使得每个图层只学习单个对象，并且除了能学到生成物体的外观还能学到物体的分割掩模。

全部详细技术资料下载

【技术实现步骤摘要】
一种无监督学习物体外观的算法
本专利技术涉及学习物体外观的领域，具体是一种无监督学习物体外观的算法。
技术介绍
无监督地学习物体的外观需要能对高维数据分布建立生成模型，这种技术直到最近几年才得到发展。现有方法主要有以下三种:生成对抗网络GAN通过对抗的方式来训练判别器网络和生成器网络,在只有真实图片的情况下,生成器可以通过判别器提供的鉴别信息来逐渐优化生成图片的真实度；变分自编码器VAE,通过训练自编码器并约束隐藏因子的分布实现以可控的隐藏分布和解码器来映射出真实分布；以及基于流的可逆生成模型Glow,通过可逆函数的雅克比矩阵直接算出映射分布的解析式,从而直接优化映射分布,以逼近真实分布。但是GAN、VAE和Glow都需要大量样本来体现数据的真实分布,因此要想无监督地学习特定类别物体的外观并能生成该类物体的逼真图片都需要大量包含该类物体的图片。这些生成模型虽然能够生成逼真的图片,但其中的前景和背景是混合在一起输出的,具体哪些像素属于前景仍然不知道,因此即使模型见过大量的该类物体,但仍然没有显式的学会该类物体的具体边界,分割掩模。
技术实现思路
本专利技术的目的在于提供一种无监督学习物体外观的算法，以解决上述
技术介绍
中提出的问题。为实现上述目的，本专利技术提供如下技术方案：一种无监督学习物体外观的算法，具体步骤如下：步骤一，准备一张包含充分多目标类别物体的图片；步骤二，对步骤一的图片进行数据预处理；步骤三，对步骤二的图片生成对抗训练学习前景外观和分割。...

【技术保护点】
1.一种无监督学习物体外观的算法，其特征在于，具体步骤如下：/n步骤一，准备一张包含充分多目标类别物体的图片；/n步骤二，对步骤一的图片进行数据预处理；/n步骤三，对步骤二的图片使用生成对抗网络训练学习前景外观和分割掩模。/n

【技术特征摘要】
1.一种无监督学习物体外观的算法，其特征在于，具体步骤如下：
步骤一，准备一张包含充分多目标类别物体的图片；
步骤二，对步骤一的图片进行数据预处理；
步骤三，对步骤二的图片使用生成对抗网络训练学习前景外观和分割掩模。

2.根据权利要求1所述的无监督学习物体外观的算法，其特征在于，所述步骤一中准备一张包含充分多目标类别物体图片的方式为从互联网上找一张目标类别物体大量拥挤在一起的图片,人工将该目标类别物体大量堆放在背景上,让目标类别物体空间分布随机并覆盖住背景。

3.根据权利要求2所述的无监督学习物体外观的算法，其特征在于，所述背景采用纯色背景。

4.根据权利要求1所述的无监督学习物体外观的算法，其特征在于，所述步骤二中数据预处理的方式为根据图中目标类别物体的尺寸选择一个窗口,从原图中根据该窗口的大小随机采样出足够数量的图片方块并且统一缩放到固定尺寸。

5.根据权利要求4所述的无监督学习物体外观的算法，其特征在于，所述窗口的大小为1.5倍最大...

【专利技术属性】
技术研发人员：李晓强，戴松民，
申请(专利权)人：上海大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人