一种基于生成式对抗网络的草图补全与识别方法和装置制造方法及图纸

技术编号：21914679 阅读：88 留言：0更新日期：2019-08-21 12:38

本发明专利技术公开一种基于生成式对抗网络的草图补全与识别方法和装置。本发明专利技术包括：(1)基于条件生成式对抗神经网络，针对草图相对于彩色图片语义信息稀疏的特点，利用级联策略对生成式对抗神经网络进行改进；(2)扩展草图补全网络的类别通用性，设置草图识别任务作为辅助任务，同时在网络结构中增加草图识别辅助网络；(3)将草图补全方法应用于残缺草图的识别任务、基于残缺草图的图像检索任务和草图场景编辑任务中；(6)集成草图补全方法形成草图补全应用平台，支持包括交互式草图补全、草图补全与识别、草图场景分割与补全、交互式草图补全辅助等应用功能，能够在PC、手机、平板电脑、电子白板等多种设备和终端上进行应用。

A Sketch Completion and Recognition Method and Device Based on Generative Countermeasure Network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成式对抗网络的草图补全与识别方法和装置
本专利技术属于计算机视觉领域，具体涉及一种基于生成式对抗网络(GenerativeAdversialNetwork，GAN)的草图补全与识别方法和装置。
技术介绍
草图是一种能直观地表达抽象概念与用户意图的自然符号(参考文献：LiuYJ,MaC,ZhaoG,etal.AnInteractiveSpiralTapeVideoSummarization[J].IEEETransactionsonMultimedia,2016,18(7):1269-1282.)，在多媒体组织与人机交互领域具有广泛的应用。近年来，草图识别(sketchrecognition)、基于草图的图像识别(sketch-basedimageretrieval,SBIR)、基于草图的图像生成(sketch-basedimagegeneration，SBIG)、草图解析(sketchparsing)、草图视频摘要(sketch-basedvideosummerization)等草图相关技术的研究都取得了巨大的进展。特别的，随着深度学习技术的引进，几个重要的草图数据库得以建立(如TU-Berlin、TheSketchyDatabase、TheSketchyScene、Fine-GrainedSBIRDatasets等草图数据库)，基于大数据的草图基础技术研究得到了进一步发展。目前的草图相关基础技术和应用技术都建立在输入草图具有完整性的前提下，完整的草图包含了视觉感知上闭合的轮廓，用一系列稀疏的线条来描述物体的关键形状特征。近十年来草图识别算法(参...

【技术保护点】
1.一种基于生成式对抗网络的草图补全方法，其步骤包括：1)建立级联生成式对抗神经网络模型，其包括生成器、判别器和分类器，所述生成器包括至少两个级联阶段，其中前一个级联阶段的输出特征与原始输入的残缺草图融合，作为后一个级联阶段的输入；2)对所述级联生成式对抗神经网络模型进行训练，训练过程中将所述分类器得到的草图识别结果作为草图类别的先验知识，辅助所述生成器和所述判别器进行草图补全；3)将残缺草图输入训练完成的所述级联生成式对抗神经网络模型，输出补全的草图。

【技术特征摘要】
1.一种基于生成式对抗网络的草图补全方法，其步骤包括：1)建立级联生成式对抗神经网络模型，其包括生成器、判别器和分类器，所述生成器包括至少两个级联阶段，其中前一个级联阶段的输出特征与原始输入的残缺草图融合，作为后一个级联阶段的输入；2)对所述级联生成式对抗神经网络模型进行训练，训练过程中将所述分类器得到的草图识别结果作为草图类别的先验知识，辅助所述生成器和所述判别器进行草图补全；3)将残缺草图输入训练完成的所述级联生成式对抗神经网络模型，输出补全的草图。2.如权利要求1所述的方法，其特征在于，所述生成器包含三个级联阶段，在提高模型草图补全效果的同时减少模型的时间开销；在生成器的第一个级联阶段，把原始输入的残缺草图x作为输入，输出中间补全结果y1；在生成器的第二个级联阶段，把x和第一阶段的输出y1进行特征融合后作为输入，输出中间补全结果y2；在生成器的第二个级联阶段，把x、第一阶段的输出y1、第二阶段的输出y2进行特征融合后作为输入，输出最终补全结果y3。3.如权利要求2所述的方法，其特征在于，步骤2)对所述级联生成式对抗神经网络模型进行训练的过程包括：2.1)将生成器最后一个级联阶段的输出y3输入分类器，对y3进行类别识别，输出一个分类损失Lossc；2.2)将生成器最后一个级联阶段的输出y3输入判别器，判别此图像是否是真实图像或者生成图像，输出一个判别损失LossD；2.3)将分类损失Lossc与判别损失LossD融合后对所述级联生成式对抗神经网络模型进行更新。4.如权利要求1所述的方法，其特征在于，所述生成器采用U-Net网络结构，在编码器和解码器堆栈中的镜像层加入跳跃链接；所述判别器采用双判别器模型，由一个局部判别器和一个全局判别器组成；所述分类器采用Sketch-a-Net中提出的草图识别模型，采用的损失函数为交叉熵损失。5.如权利要求1所述的方法，其特征在于，对所述级联生成式对抗神经网络模型进行训...

【专利技术属性】
技术研发人员：马翠霞，刘舫，邓小明，王宏安，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人