The invention discloses a multi-label image classification method, which is characterized by steps 1, collecting image samples, step 2, data preprocessing, step 3, customizing the depth network structure according to the size of training samples, step 4, training to convergence with the goal of predicting the average loss of various labels, step 5, training completion, and prediction of the label attributes of the image to be tested. In the case of large-scale sample training, the prediction effect is better than machine learning; in engineering applications, according to different sample sizes, customize the adapted deep network structure, construct appropriate network structure training to convergence, and have obtained reliable multi-label classification model, which achieves an average of 96% high accuracy; multi-label classification can be predicted by further layers on the basis of multi-classification. A group of label attributes of pictures can more perfectly cater to the tasks of image screening, material classification and archiving.
【技术实现步骤摘要】
一种图片多标签分类方法
本专利技术涉及计算机的图像深度学习领域,特别是涉及一种图片多标签分类方法。
技术介绍
1张图片包含多元信息,图片分类技术只允许1张图片对应1个预测目标,如手写数字识别,1张手写数字图片仅对应1个0-9的数字识别结果,不能预测出字体风格,书写美观度等多重属性,往往不能满足应用的需求。因此,需要一种图片分类方法,能允许1个输入样本对应1组目标输出,即1张图片预测1组与之相关的标签属性,这样可以更方便地进行图片筛选,素材分类归档等任务。在工程应用中,能获取到的图片样本规模因项目而异,时多时少,针对不同样本规模,需要构造不同复杂程度的网络结构进行训练,才能得到可靠预测效果,否则无法达到应用门槛。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足,提供一种图片多标签分类方法。为解决上述技术问题,本专利技术提供一种图片多标签分类方法,其特征在于,包括如下步骤:步骤1、收集图片样本,所述图片样本规模至少在100k张;整理每张图对应的1组标签属性,所述1组标签属性至少包含2个标签属性,所述不同标签属性之间互相独立,不存在范围重叠或包含关系;步骤2 ...
【技术保护点】
1.一种图片多标签分类方法,其特征在于,包括如下步骤:步骤1、收集图片样本,所述图片样本规模至少在100k张;整理每张图对应的1组标签属性,所述1组标签属性至少包含2个标签属性,所述不同标签属性之间互相独立,不存在范围重叠或包含关系;步骤2、数据的预处理,将每张图片尺寸更改为224×224×3;步骤3、根据训练样本规模,定制的深度网络结构,所述深度网络结构由keras定制,网络输出类别数即标签类别数;所述深度网络结构包括至少5个卷积层:卷积层由至少32个卷积核串联构成,全连接层包含256个节点,dropout随机丢弃节点设为0.5,并行soft‑max(parallel‑s ...
【技术特征摘要】
1.一种图片多标签分类方法,其特征在于,包括如下步骤:步骤1、收集图片样本,所述图片样本规模至少在100k张;整理每张图对应的1组标签属性,所述1组标签属性至少包含2个标签属性,所述不同标签属性之间互相独立,不存在范围重叠或包含关系;步骤2、数据的预处理,将每张图片尺寸更改为224×224×3;步骤3、根据训练样本规模,定制的深度网络结构,所述深度网络结构由keras定制,网络输出类别数即标签类别数;所述深度网络结构包括至少5个卷积层:卷积层由至少32个卷积核串联构成,全连接层包含256个节点,dropout随机丢弃节点设为0.5,并行soft-max(parallel-soft-max)用于分别预测各类标签属性,各soft-max层并联连接;步骤4、以预测各类标签的平均损失为目标,训练至收敛;步骤5、训练完成,预测待测图片的标签属性。2.如权利要求1所述的一种图片多标签分类方法,其特征在于:所述步骤3中,当样本数量在100k-1000k张,则构建包含5个卷积层的深度网络,其中...
【专利技术属性】
技术研发人员:王旻毅,吕晨,房鹏展,
申请(专利权)人:焦点科技股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。