基于先验概率分布的图像生成方法、系统、介质及设备技术方案

技术编号:39249129 阅读:24 留言:0更新日期:2023-10-30 12:01
本发明专利技术提供了一种基于先验概率分布的图像生成方法、系统、介质及设备,其属于图像生成技术领域,所述方案为了避免人为分布假设对模型的影响,构建了一个用于采样数据分布的学习器,即一种将分类神经网络和高斯混合模型结合的混合密度网络,通过所述学习器对输入数据进行分类,并把输出的信息送入高斯混合模型中,通过计算高斯混合模型中子模型的隐变量确定高斯混合分布的参数,并将所述参数作为VAE模型(即变分自编码器)的解码器重参数化步骤中随机向量采样分布的参数,来指导VAE模型的训练,有效保证模型训练的准确性,进而有效保证了图像生成的准确性。了图像生成的准确性。了图像生成的准确性。

【技术实现步骤摘要】
基于先验概率分布的图像生成方法、系统、介质及设备


[0001]本专利技术属于图像生成
,尤其涉及一种基于先验概率分布的图像生成方法、系统、介质及设备。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]机器学习和人工智能已经在目标识别、文本翻译、策略博弈等许多方面达到与人类相当的水平甚至超过人类。进一步思考,计算机能否模仿创作过程,从而协助人类进行内容的创作和生成,过去的十年中,图像生成技术取得了长足的进步,现有方法在一定条件下已经可以生成人眼难以辨识真假的图像。在这些技术中,通过图片、文本、声音等简单易得的内容进行图像生成,将极大提升人类的创造能力,扩展内容生成领域的边界。
[0004]基于深度学习的图像生成技术已经成为当今人工智能领域的一项重要研究内容。它旨在使用机器学习技术从数据中生成虚拟图像,其中包含有用的信息,而这些信息可以用来改善诸如视觉检测、图像分类和图像生成等技术,也可以用来实现可视化分析、可视化设计和虚拟演练等。
[0005]深度学习可以充分利用大量数据,通过对数据进行训练,学习图像、文字和声音中有意义的模式、结构等数据特征,从而准确地模拟人类视觉系统。它可以从社会、文化以及自然界等环境中捕捉和抽象视觉特征。此外,它有助于建立更加准确和可靠的模型,即使在面对噪声和错误的情况下也能保持准确性。
[0006]当前,深度学习技术已经被广泛应用于图像生成领域。例如,VAE(Variational Autoencoders:变分自编码器)是基于深度学习的图像生成模型,从给定的图像数据集中学习、识别视觉特征,并将学到的特征用于新图像的生成。VAE的思路是编码器要学习输入数据的分布,从分布里面采样一些特征作为数据的潜在表示,并作为解码器的输入,解码器要学会把潜在表示重构回原始数据。在传统VAE模型的训练过程中,随机噪声的采样是基于人为的分布假设,这与数据的真实分布会存在一定差异;同时,编码过程中可能会把原始数据中的噪声一并编码,以上情况都会影响图像生成的准确性。

技术实现思路

[0007]本专利技术为了解决上述问题,提供了一种基于先验概率分布的图像生成方法、系统、介质及设备,所述方案为了避免人为分布假设对模型的影响,构建了一个用于采样数据分布的学习器,即一种将分类神经网络和高斯混合模型结合的混合密度网络,通过所述学习器对输入数据进行分类,并把输出的信息送入高斯混合模型中,通过计算高斯混合模型中子模型的隐变量确定高斯混合分布的参数,并将所述参数作为VAE模型(即变分自编码器)的解码器重参数化步骤中随机向量采样分布的参数,来指导VAE模型的训练,有效保证模型训练的准确性,进而有效保证了图像生成的准确性。
[0008]根据本专利技术实施例的第一个方面,提供了一种基于先验概率分布的图像生成方法,包括:将有标记图像数据作为分类神经网络模型的输入进行分类;通过高斯混合模型对神经网络模型的分类结果进行拟合,获得对应的高斯混合分布;以无标记图像数据作为变分自编码器的输入进行变分自编码器的训练,基于变分自编码器中的编码器获得输入数据的分布参数;将高斯混合分布中的随机采样数据以及编码器输出的分布参数进行组合,并将组合数据作为变分自编码器中解码器的输入,通过所述解码器获得输入数据的重构数据;其中,所述变分自编码器的训练以最小化重构数据与输入数据之间的误差为目标;以训练好的变分自编码器中的解码器作为图像生成器,实现图像生成。
[0009]进一步的,所述编码器的输出包括输入数据的均值和方差分布参数,所述将高斯混合分布中的随机采样数据以及编码器输出的分布参数进行组合,具体表示如下:
[0010]其中,为均值向量,为方差向量,为从高斯混合分布中随机采样的数据向量。
[0011]进一步的,所述编码器采用顺序连接的全连接层、卷积层、全连接层的架构,且所述编码器的最后一层并联有聚类器,通过所述聚类器对编码器最后一层特征信息进行聚类。
[0012]进一步的,所述聚类器采用DBSCAN聚类器。
[0013]进一步的,所述将有标记图像数据作为分类神经网络模型的输入进行分类,以及以无标记图像数据作为变分自编码器的输入进行变分自编码器的训练中,预先对有标记图像数据和无标记图像数据进行数据增强,其中,所述数据增强操作包括随机裁剪、水平翻转、垂直翻转、随机旋转、改变亮度以及添加噪声。
[0014]进一步的,所述分类神经网络采用ReLU激活函数以及交叉熵损失函数,其中,所述交叉熵损失函数具体表示如下:
[0015]其中,m为类别数量;为符号函数,如果样本i真实类别等于c则为1,否则为0;是观测样本i属于类别c的预测概率,N为分类神经网络的规模。
[0016]进一步的,所述分类神经网络模型采用卷积神经网络。
[0017]根据本专利技术实施例的第二个方面,提供了一种基于先验概率分布的图像生成系统,包括:数据分布采样单元,其用于将有标记图像数据作为分类神经网络模型的输入进行分类;通过高斯混合模型对神经网络模型的分类结果进行拟合,获得对应的高斯混合分布;变分自编码器训练单元,其用于以无标记图像数据作为变分自编码器的输入进行变分自编码器的训练,基于变分自编码器中的编码器获得输入数据的分布参数;将高斯混合分布中的随机采样数据以及编码器输出的分布参数进行组合,并将组合数据作为变分自
编码器中解码器的输入,通过所述解码器获得输入数据的重构数据;其中,所述变分自编码器的训练以最小化重构数据与输入数据之间的误差为目标;图像生成单元,其用于以训练好的变分自编码器中的解码器作为图像生成器,实现图像生成。
[0018]根据本专利技术实施例的第三个方面,提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上所述的一种基于先验概率分布的图像生成方法。
[0019]根据本专利技术实施例的第四个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如上所述的一种基于先验概率分布的图像生成方法。
[0020]与现有技术相比,本专利技术的有益效果是:(1)本专利技术所述方案提出一种基于先验概率分布的图像生成方法、系统、介质及设备,所述方案为了避免人为分布假设对模型的影响,构建了一个用于采样数据分布的学习器,即一种将分类神经网络和高斯混合模型结合的混合密度网络,通过所述学习器对输入数据进行分类,并把输出的信息送入高斯混合模型中,通过计算高斯混合模型中子模型的隐变量确定高斯混合分布的参数,并将所述参数作为VAE模型(即变分自编码器)的解码器重参数化步骤中随机向量采样分布的参数,来指导VAE模型的训练,有效保证模型训练的准确性,进而有效保证了图像生成的准确性。
[0021](2)本专利技术所述方案中,对VAE模型训练过程中重参数化这一步骤,使用高斯混合分布中采样出的随机向量,同时,在编码器学习过程中引入类别监督信息,结合聚类方法提高特征学习的鲁棒性。
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于先验概率分布的图像生成方法,其特征在于,包括:将有标记图像数据作为分类神经网络模型的输入进行分类;通过高斯混合模型对神经网络模型的分类结果进行拟合,获得对应的高斯混合分布;以无标记图像数据作为变分自编码器的输入进行变分自编码器的训练,基于变分自编码器中的编码器获得输入数据的分布参数;将高斯混合分布中的随机采样数据以及编码器输出的分布参数进行组合,并将组合数据作为变分自编码器中解码器的输入,通过所述解码器获得输入数据的重构数据;其中,所述变分自编码器的训练以最小化重构数据与输入数据之间的误差为目标;以训练好的变分自编码器中的解码器作为图像生成器,实现图像生成。2.如权利要求1所述的一种基于先验概率分布的图像生成方法,其特征在于,所述编码器的输出包括输入数据的均值和方差分布参数,所述将高斯混合分布中的随机采样数据以及编码器输出的分布参数进行组合,具体表示如下:其中,为均值向量,为方差向量,为从高斯混合分布中随机采样的数据向量。3.如权利要求1所述的一种基于先验概率分布的图像生成方法,其特征在于,所述编码器采用顺序连接的全连接层、卷积层、全连接层的架构,且所述编码器的最后一层并联有聚类器,通过所述聚类器对编码器最后一层特征信息进行聚类。4.如权利要求3所述的一种基于先验概率分布的图像生成方法,其特征在于,所述聚类器采用DBSCAN聚类器。5.如权利要求1所述的一种基于先验概率分布的图像生成方法,其特征在于,所述将有标记图像数据作为分类神经网络模型的输入进行分类,以及以无标记图像数据作为变分自编码器的输入进行变分自编码器的训练中,预先对有标记图像数据和无标记图像数据进行数据增强,其中,所述数据增强操作包括随机裁剪、水平翻转、垂直翻转、随机旋转、改变亮...

【专利技术属性】
技术研发人员:袭肖明何志强郭子康乔立山张淑涵宁一鹏张玉龙纪孔林聂秀山
申请(专利权)人:山东建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1