一种基于场景识别的草图图像翻译方法技术

技术编号：26420155 阅读：59 留言：0更新日期：2020-11-20 14:15

本发明专利技术公开了一种基于场景识别的草图图像翻译方法。用户在所选取的场景图背景上交互式的逐步绘制草图，系统根据场景识别网络识别出的场景图类别对轮廓草图进行语义匹配得到对象类别，再根据对象类别与草图，利用部分草图形状完成网络与完整图像外观生成网络进行轮廓与外观合成，经过交互式的绘制最终生成需要的前景对象图像。本发明专利技术可以允许用户不用进行整个场景级别的草图绘制，只需在现有的场景背景图上描绘前景部分的对象草图，系统会自动进行与背景场景图语义匹配的对象完成，使得最终生成的图像质量与清晰度更高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于场景识别的草图图像翻译方法
本专利技术涉及计算机视觉、图像处理
，具体涉及一种基于场景识别的草图图像翻译方法。
技术介绍
绘制草图是用于人类表达和传递信息的最自然与灵活的途径之一。近年来随着触屏设备的日益普及，在触屏上以寥寥数笔绘制草图来表达人类的视觉需求，已经成为重要的人机的交互方式。随着深度学习在图像处理领域的蓬勃发展，草图完成、草图识别、草图编辑和草图检索等一系列草图领域的技术应用得以飞速发展。草图-图像翻译是一类图像生成任务。结合用户界面，用户可以在目标域中利用徒手绘制的抽象草图快速创建图像。由于草图具有高度抽象性，且不同人绘制的草图在完成的准确度与风格上可能有很大的不同，因此草图-图像翻译问题仍面临着巨大的挑战。场景识别与分类问题是计算机视觉领域中的重要问题。场景由图像中的局部对象、全局布局和背景环境多级信息组成。随着深度学习技术的巨大进展，大规模的场景数据集基准(如Place2、Place365等)得以建立，基于深度学习的解决方案取代了基于原始手工提取特征的解决方案，从而更好地促进了场景识别与分类性能的提高。目前的现有技术之一是Ghosh等的《Interactivesketch&fill:Multiclasssketch-to-imagetranslation》所提出的SkinnyResnet网络结构，该方法根据用户输入的类条件，通过对用户逐步绘制的部分轮廓草图进行及时反馈，交互式的向用户推荐合理的草图完成轮廓并显示相应的合成图像，从而有效地帮助新手用户创建简

【技术保护点】
1.一种基于场景识别的草图图像翻译方法，其特征在于，所述方法包括：/n构建对象数据集与场景数据集并进行语义匹配，对对象数据集的原始图像进行边缘检测与简化从而得到完整对象边缘图像，之后进行随机遮挡掩模处理以模拟用户的部分草图输入从而得到不完整对象边缘图像，对场景数据集进行场景识别预训练产生OPlace365-Resnet50网络；/n用户从所述场景数据集中选取场景背景图，然后利用所述OPlace365-Resnet50网络对所选取的场景背景图进行分类识别，得到场景类别；/n利用所述完整对象边缘图像和所述不完整对象边缘图像作为数据集训练部分草图形状完成网络，利用所述对象数据集的原始图像和所述完整对象边缘图像作为数据集训练完整图像外观生成网络；/n所述场景类别通过所述语义匹配得到对应的对象类别，之后所述部分草图形状完成网络根据对象类别和用户描绘的部分草图生成完整的草图轮廓，然后所述完整图像外观生成网络再根据对象类别和所生成的完整草图轮廓生成带有颜色和纹理的前景图像；/n用户根据所述带有颜色和纹理的前景图像交互式的进行下一笔草图描绘，直到生成在所述用户选取的场景背景图上满足用户需求的前景对象图像，即为最终生成图像。/n...

【技术特征摘要】
1.一种基于场景识别的草图图像翻译方法，其特征在于，所述方法包括：
构建对象数据集与场景数据集并进行语义匹配，对对象数据集的原始图像进行边缘检测与简化从而得到完整对象边缘图像，之后进行随机遮挡掩模处理以模拟用户的部分草图输入从而得到不完整对象边缘图像，对场景数据集进行场景识别预训练产生OPlace365-Resnet50网络；
用户从所述场景数据集中选取场景背景图，然后利用所述OPlace365-Resnet50网络对所选取的场景背景图进行分类识别，得到场景类别；
利用所述完整对象边缘图像和所述不完整对象边缘图像作为数据集训练部分草图形状完成网络，利用所述对象数据集的原始图像和所述完整对象边缘图像作为数据集训练完整图像外观生成网络；
所述场景类别通过所述语义匹配得到对应的对象类别，之后所述部分草图形状完成网络根据对象类别和用户描绘的部分草图生成完整的草图轮廓，然后所述完整图像外观生成网络再根据对象类别和所生成的完整草图轮廓生成带有颜色和纹理的前景图像；
用户根据所述带有颜色和纹理的前景图像交互式的进行下一笔草图描绘，直到生成在所述用户选取的场景背景图上满足用户需求的前景对象图像，即为最终生成图像。

2.如权利要求1所述的一种基于场景识别的草图图像翻译方法，其特征在于，所述构建对象数据集与场景数据集并进行语义匹配，具体为：
从Place365数据集中提取其中的二十个类别构建成场景数据集；
对象数据集与场景数据集各包括二十个类别的图像；
对对象数据集中二十个类别的图像与场景数据集中二十个类别的图像进行一对一的语义匹配。

3.如权利要...

【专利技术属性】
技术研发人员：周凡，陈茜茜，苏卓，林淑金，王若梅，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人