【技术实现步骤摘要】
基于GAN网络结构的三阶段瓷砖图像生成方法
[0001]本专利技术涉及图像生成领域,提出了一种基于GAN网络结构的三阶段瓷砖图像生成方法,该方法能够快速地生成多样化瓷砖图像,生成图像符合人的直观感受,对工业瓷砖图像设计具有很好的参考意义。
技术介绍
[0002]随着人工智能的快速发展,越来越多相关的技术相继被提出。作为实现人工智能的主要方法,机器学习需要基于已有数据集的特性,对未知的数据进行预测。根据数据集是否含有标签属性,可将机器学习分为监督学习、无监督学习和半监督学习三大类。
[0003]目前在机器学习中,已有很多关于图像生成的方法。在无监督学习领域,Kingma和Welling提出变分自编码器模型,模型包含AutoEncoder和AutoDecoder模块,用于训练图像与编码后的向量之间的双向关系,并对编码后的向量基于高斯分布进行随机扰动,在已有图片的基础上生成更多相似的图片,以增加图像的多样性。他们的模型在手写数字图片的生成中得到了很好的应用。Oord等人提出了Pixel CNN,一种基于门控结构的网络结构, ...
【技术保护点】
【技术特征摘要】
1.一种基于GAN网络结构三阶段瓷砖图像生成方法,其特征在于,所述方法包含如下步骤:S1、以若干128维的向量作为输入,通过预先训练的多尺度梯度风格生成对抗网络(Multi
‑
Scale Gradient Style GAN),生成若干大小为256*256像素的灰度图像块发送给用户端供用户挑选指定,并根据用户端反馈的指定结果对应选择其中一张作为瓷砖内容图像;S2、根据指定的瓷砖风格样图,生成12维的特征向量,特征向量由瓷砖风格样图中R、G、B三个通道的像素值平均值以及瓷砖风格样图对应的灰度图像的灰度共生矩阵的9项纹理统计量组成;获取由风格池中不同的风格图像基于纹理合成生成对抗网络(Non
‑
Stationary Gradient Style GAN)训练的瓷砖风格模型,并计算瓷砖风格样图的特征向量和风格池中所有风格图像对应特征向量之间的余弦相似度,取相似度最高的前M张风格图像发送给用户端供用户挑选指定,并根据用户端反馈的最符合用户要求的风格图像指定结果,选择出该指定的风格图像对应的最佳瓷砖风格模型;S3、将S1中得到的瓷砖内容图像转换为三通道图像输入至S2选出的最佳瓷砖风格模型中,输出大小为512*512像素的瓷砖风格图像,并将输出的瓷砖风格图像再次作为所述最佳瓷砖风格模型的输入,再重复迭代k
‑
1次,最终生成大小为(256*2
k
)*(256*2
k
)像素的瓷砖风格图像;S4、将S3中最终生成的瓷砖风格图像,基于双三次插值图像放大算法进行图像放大,并对放大后的图像发送给用户端进行感兴趣区域的图像裁切,生成最终瓷砖图像。2.根据权利要求1所述的基于GAN网络结构三阶段瓷砖图像生成方法,其特征在于,所述步骤S1中,灰度图像块的生成过程如下:首先,生成一系列128维特征向量v1,其中v1=[v
1,1
,v
1,2
,
…
,v
1,128
]
T
,v
1,t
∈[0,1],1≤t≤128;然后,针对每一个特征向量v1,通过多尺度梯度风格生成对抗网络MSGS
‑
GAN,生成大小为256*256像素的灰度图像块I
(0)
=MSGS
‑
GAN(v1);不同的特征向量v1输出的灰度图像块内容也不同。3.根据权利要求1所述的基于GAN网络结构三阶段瓷砖图像生成方法,其特征在于,所述步骤S2的具体过程如下:S21、获取用户指定输入的风格样图S,并将风格样图S转化成12维的特征向量v2=[v
2,1
,v
2,2
,v
2,3
,v
2,4
,v
2,5
,v
2,6
,v
2,7
,v
2,8
,v
2,9
,v
2,10
,v
2,11
,v
2,12
],特征向量中每一个分量计算方法如下:S211、计算风格样图S中R、G、B三个通道的像素值平均值得到v
2,1
~v
2,3
,其中:R通道像素值平均值为:G通道像素值平均值为:B通道像素值平均值为:
式中:S(i,j,1)、S(i,j,2)、S(i,j,3)分别表示R通道、G通道、...
【专利技术属性】
技术研发人员:石梦韬,李黎,陆剑锋,童峻涛,赵唯皓,陈作磊,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。