一种采用深度神经网络的缩略图自动生成的方法技术

技术编号：15331157 阅读：71 留言：0更新日期：2017-05-16 14:28

本发明专利技术中提出的一种采用深度神经网络的缩略图自动生成的方法，其主要内容包括：数据集训练、边界框的预测、输入图像和缩略尺寸对、模型训练、快速自动缩略图生成FATG实现，其过程为，首先采用互联网图片建立数据库进行训练，输入原图和目标缩略尺寸，采用FATG模型，结合RPN(区域建议网络)和R‑FCN(基于区域的全卷积网络)，预测边界框位置确定包含重要信息的区域，并在此预测框的中心产生一个宽高比等于目标缩略图尺寸的边界框，扩展直至触及边界即生成所需尺寸的缩略图。本发明专利技术突破缩略图生成耗时且易丢失重要信息的问题，更为快速准确地获得所需尺寸下的缩略图，使得图片缩略更加精准且实时，方便人们日常浏览和上传图像。

A method of automatic generation of thumbnails using depth neural networks

A method of using deep neural network thumbnail of the present invention is automatically generated, the main contents include: training data set, bounding box prediction, input image and thumbnail size on, model training, automatic thumbnail generation FATG, the process is, firstly to establish a database for training using the Internet image input image and the target thumbnail size, using the FATG model, combined with RPN and R (regional network) FCN (full convolutional network based on region), areas that contain important information to identify predictors of bounding box position, and then predict the center of the box to produce a width equal to the target thumbnail size of the bounding box, extended until it touches the border to generate the required size of thumbnails. The invention breaks through the thumbnail generation time-consuming and easy to lose important information, more quickly and accurately obtain the required size of the thumbnail, making the picture thumbnail more accurate and real-time, convenient for people's daily browse and upload images.

全部详细技术资料下载

【技术实现步骤摘要】
一种采用深度神经网络的缩略图自动生成的方法
本专利技术涉及缩略图生成领域，尤其是涉及了一种采用深度神经网络的缩略图自动生成的方法。
技术介绍
缩略图用于方便地浏览图像集合，经济使用显示空间，并减少传输时间。缩略图是原始图像的较小版本，这意味着其仍可有效描绘原始图像。诸如微信，微博等社交媒体网站，发布的内容来源广泛，但图片均需按固定分辨率显示。微信订阅上一个普通文章就包含数十张图像，若要保证显示效果，其本质上都是较大图像的缩略图。因此，确保每个缩略图能显示原始图像中最有用的信息是非常重要的。由于缩略图无所不在而且手动生成缩略图非常耗时，所以自动生成缩略图有相当的研究意义。创建缩略图的传统方法是利用显著图来识别图像中可作为优质裁剪的区域来创建缩略图，而最近的方法在实际操作上也需要60秒来产生单个缩略图。本专利技术提出了一种采用深度神经网络的缩略图自动生成的方法即FATG(快速自动缩略图生成)，采用互联网图片库进行训练，输入原图，设置目标缩略尺寸，采用FATG模型，通过训练学习针对不同的宽高比的不同滤波器。FATG模型采用RPN(区域建议网络)和R-FCN(基于区域的全卷积网络)，结合了这两种网络，预测边界框位置确定包含重要信息的图像区域，并在此预测框的中心产生一个宽高比和目标缩略图相等的新边界框，扩展直到触及图片边界即完成重要信息得以保留的基础下生成所需尺寸下的缩略图，使得图片缩略更加精准且实时，方便人们日常浏览和上传图像。
技术实现思路
针对缩略图生成耗时且易丢失重要信息等问题，本专利技术的目的在于提供一种采用深度神经网络的缩略图自动生成的方法，使用互联网图片建...

【技术保护点】
一种采用深度神经网络的缩略图自动生成的方法，其特征在于，主要包括数据集训练(一)；边界框的预测(二)；输入图像和缩略尺寸对(三)；模型训练(四)；快速自动缩略图生成FATG实现(五)。

【技术特征摘要】
1.一种采用深度神经网络的缩略图自动生成的方法，其特征在于，主要包括数据集训练(一)；边界框的预测(二)；输入图像和缩略尺寸对(三)；模型训练(四)；快速自动缩略图生成FATG实现(五)。2.基于权利要求书1所述的数据集训练(一)，其特征在于，采用互联网图片建立数据库，称为互联网图片库，其中收集了包括人物、动物、建筑、风景、运动等类别，总数高达100000张图片；对于每张图片，数据集中给出了图片的原图、缩略图，缩略图大小为130*130左右。3.基于权利要求书1所述的边界框的预测(二)，其特征在于，采用深度卷积神经网络学习最优边界框来产生缩略图，包含RPN(区域建议网络)和R-FCN(基于区域的全卷积网络)。4.基于权利要求书3所述的RPN(区域建议网络)，其特征在于，可使计算时间显著减少，此外通过引入一个由特定类别的位置敏感滤波器组成的卷积层来减少建议特征前向传播的计算成本；具体来说，若有C类物体要检测，那么这个新的卷积层将产生k2(C+1)个特征图，k2个位置敏感分数图对应于目标的k×k个均匀分割的单元，这k2个特征图对应不同相对位置的空间网格，对于每个类别诸如(左上，...，左下)；k＝3，则对应于一个3×3的空间网格、以及每个类有9个位置敏感滤波器，每个类(包括背景)，将关联k2个特征图，不是通过两个全连接层前向传播，而是正敏感池化后分数平均，生成一个(C+1)-d向量并且用于预测各个类别的softmax结果。5.基于权利要求书3所述的R-FCN(基于区域的全卷积网络)，其特征在于，通过引入一组特定宽高比的滤波器组来修改R-FCN用于缩略图创建；引入一组A点，宽高比在[0.5，2]的范围内，以恒定因子(几何序列)增长，例如，此处可求得最后一个卷积层的滤波器组在R-FCN中被修改成A个对，每一对共具有k2个滤波器，每一对均与集合S中的单个元素相关联，与R-FCN类似，位置敏感池化、计算均值，然后用这两个值产生softmax代表性预测。6.基于权利要求书3所述的缩略图生成，其特征在于，生成缩略图的架构应完全卷积，因为包括完全连接层也需要固定的输入尺寸，如果图像的宽高比和固定输入尺寸之间不匹配，图像除了缩放外，还必须裁剪，缩略图裁剪(边界框)可以达到图...

【专利技术属性】
技术研发人员：夏春秋，
申请(专利权)人：深圳市唯特视科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人