结合ACGAN的图像样本处理方法、装置、系统和介质制造方法及图纸

技术编号:23558837 阅读:23 留言:0更新日期:2020-03-25 04:16
本申请提供的一种结合ACGAN的图像样本处理方法、装置、系统和介质,通过将真实图像样本输入SRResNet网络模型,读取所述真实图像样本的类别并得到伪标准图像样本;于标准图像样本的数据列表中随机挑选一相应类别的标准图像样本;将伪标准图像样本与标准图像样本输入ACGAN判别器,以分别得到二者真假概率值和类别概率值;依据真假概率值和类别概率值返回损失函数,以调整SRResNet网络模型,直至输出所述真假概率值为真假概率相等;将待测试图像样本输入SRResNet网络模型以得到对应的测试标准图像样本。本申请可以利用各种如身份证、行驶证和驾驶证等真实样本生成统一的标准样本,同时通过将超分辨网络模型SRResNet和ACGAN结合起来,得到更为逼真的伪标准样本。

Image sample processing method, device, system and medium combined with acgan

【技术实现步骤摘要】
结合ACGAN的图像样本处理方法、装置、系统和介质
本专利技术涉及卷积神经网络
,特别是涉及一种结合ACGAN的图像样本处理方法、装置、系统和介质。
技术介绍
在训练驾驶证、行驶证和身份证等证件类的汉字分类器的过程中,由于各类证件的字体大小和背景存在较大差异,所以我们需要为每个证件训练一个特定的类别分类器,使得人工标注需要花费大量的人力财力。而且训练出来的模型在实际使用过程中只能针对特定的证件,且类别数非常有限。为了增加汉字的类别数且减少训练模型的工作量,本专利技术以SRResNet作为生成器,结合ACGAN去生成统一的汉字文本。本专利技术算法以相同类别的真实样本(包含身份证、行驶证和驾驶证等实际汉字样本)和标准样本为一对输入,且标准样本作为真实样本的标签来对训练进行约束。算法有效且实际应用价值极高。
技术实现思路
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种结合ACGAN的图像样本处理方法、装置、系统和介质,以增加汉字的类别数且减少训练模型的工作量。为实现上述目的及其他相关目的,本申请提供一种结合AC本文档来自技高网...

【技术保护点】
1.一种结合ACGAN的图像样本处理方法,其特征在于,所述方法包括:/n将真实图像样本输入SRResNet网络模型,读取所述真实图像样本的类别并得到伪标准图像样本;/n于标准图像样本的数据列表中随机挑选一相应类别的所述标准图像样本;/n将所述伪标准图像样本与所述标准图像样本输入ACGAN判别器,以分别得到二者真假概率值和类别概率值;/n依据所述真假概率值和类别概率值返回损失函数,以调整所述SRResNet网络模型,直至输出所述真假概率值为真假概率相等;/n将待测试图像样本输入所述SRResNet网络模型以得到对应的测试标准图像样本。/n

【技术特征摘要】
1.一种结合ACGAN的图像样本处理方法,其特征在于,所述方法包括:
将真实图像样本输入SRResNet网络模型,读取所述真实图像样本的类别并得到伪标准图像样本;
于标准图像样本的数据列表中随机挑选一相应类别的所述标准图像样本;
将所述伪标准图像样本与所述标准图像样本输入ACGAN判别器,以分别得到二者真假概率值和类别概率值;
依据所述真假概率值和类别概率值返回损失函数,以调整所述SRResNet网络模型,直至输出所述真假概率值为真假概率相等;
将待测试图像样本输入所述SRResNet网络模型以得到对应的测试标准图像样本。


2.根据权利要求1所述的方法,其特征在于,所述读取所述真实图像样本的类别并得到伪标准图像样本,包括:
将所述真实图像样本输入所述SRResNet网络模型的一个卷积层C11和激活函数PReLU层PR11得到特征图X1;
所述特征图X1经过多个残差模块得到特征图X2;
所述特征图X2经过一个卷积层C12和归一化层BN11得到特征图X3;
将所述特征图X1和所述特征图X3经过第一激活函数Elementive_sum层进行对应像素累加以得到特征图X4;
所述特征图X4经过一个卷积层C13得到所述伪标准图像样本。


3.根据权利要求2所述的方法,其特征在于,所述残差模块包括:
依次连接的卷积层C21、激活函数PReLU层PR21、归一化层BN21、激活函数PReLU层PR22、卷积层C22、归一化层BN22、及第二激活函数Elementive_sum层。


4.根据权利要求1所述的方法,其特征在于,所述ACGAN判别器包括:
依次连接的卷积层C31、激活函数PReLU层PR31、池化层P31、卷积层C32、激活函数PReLU层PR32、池化层P32、卷积层C33、激活函数PReLU层PR33、卷积层C34、激活函数PReLU层PR34、全连接层FC31、全连接层FC32、全连接层FC33、全连接层FC34、激活函数sigmoid层、及激活函数softmax层;
其中,所述全连接层FC32一方面依次连接所述全连接层FC33、及所述激活...

【专利技术属性】
技术研发人员:周康明彭山珍
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1