一种图片风格识别方法及装置制造方法及图纸

技术编号:15691517 阅读:184 留言:0更新日期:2017-06-24 04:47
本申请提供了一种图片风格识别方法及装置。所述方法包括:获取样本图片,按照预设方式对所述样本图片进行处理后形成样本训练集;对预先设置的多目标卷积神经网络进行参数初始化以及将样本训练集中的样本图片在参数初始化后的多目标卷积神经网络中进行训练得到图片风格识别模型;利用图片风格识别模型对待识别图片进行识别,获取待识别图片属于不同风格类型的概率向量,概率向量中每个风格类型的概率值的取值范围为0至1;根据预先设置的判断规则和概率向量识别待识别图片所属的风格类型。利用本申请实施例提供的技术方案,可以实现对商品图片的风格进行自动、准确的识别,可以提高图片风格识别效率,降低作业人员的工作强度,提升用户体验。

Picture style identification method and device

The present application provides a picture style identification method and apparatus. The method comprises: obtaining sample images, form the training set for processing the sample image according to a preset mode; the multi-objective convolutional neural network preset parameter initialization and the sample training set for training sample images in multiple target convolutional neural network parameters initialization after get the picture style recognition model; use the picture style recognition model to recognize image recognition, acquisition probability vector to identify pictures belonging to different styles, each style of probability probability vector values in the range of 0 to 1; according to the style preset judgment rule and probability vector recognition to identify the picture. By using the technical scheme provided by the embodiment of the application, can be achieved on the product picture style recognition automatically and accurately, can improve the picture style recognition efficiency, reduce the work intensity of workers, improve the user experience.

【技术实现步骤摘要】
一种图片风格识别方法及装置
本申请属于图像信息处理
,尤其涉及一种图片风格识别方法及装置。
技术介绍
随着互联网消费时代的发展,消费者可以线上挑选自己喜爱的商品,极大的方便了用户购物。例如消费者可以通过线上商家展示的商品图片选取自己喜欢的商品种类。一般的,消费者在线上购买商品时往往会受到多种概念因素的影响,例如比如品牌、价格、颜色、风格类型等,这些概念因素一般可以由商家在服务操作平台进行人工设置。在众多概念因素中,一些例如服装的品牌、价格、色彩等因素通常是容易定义,且一般有着相对明确、规范的界限进行区分。而对于其他一些商品的概念如服装风格,由于概念的语义性较强,受个人主观判断影响严重等,导致不同的商家或消费者对具体的某一件服装风格定义上出现较大偏差。例如有的消费者会认为服装上包含了字母“ROCK”的应该是街头风格,有的消费者则会认为服装上有铆钉等元素的是街头风格。而对于服装设计者来说,可能综合了各种各样的元素来组成最后的成品,其中可能包含了街头的元素,也可能有民族或文艺的元素。经过一些实际应用数据分析,发现约有15%的消费者在购买服装类商品时,会结合风格关键词进行商品搜索,这个比例仅仅落后于服装的品牌和类目两个因素。可见商品风格类型这个因素对于线上商品导购起到非常重要的作用。然而,无论是商家还是消费者会在判断填写商品所属的风格类型时往往会因为出现主观因素影响出现较大偏差,因此类似这样商品风格类型的概念在商家和消费者中常常产生混淆和歧义,影响商家商品的风格分类或者消费者商品风格的筛选,降低商品营销效果。这样不仅影响成交转化率,也降低了用户体验。同时,由于线上商品种类繁多,一般在涉及商品风格类型处理的信息量较大,也会消耗作业人员大量的作业时间和劳动量。现有技术中采用人工主观判断的方式对商品风格进行识别往往会导致商品风格识别结果的差异化较大,难以进行准确、合理、统一的风格识别。同时采用人工识别的判断方式也加大了作业人员商品风格识别的工作强度,降低了风格识别效率。
技术实现思路
本申请目的在于提供一种图片风格识别方法及装置,可以实现对商品图片的商品风格类型进行自动、准确的识别,可以提高商品风格识别准确性和效率,降低作业人员的工作强度。本申请提供一种图片风格识别方法及装置是这样实现的:一种图片风格识别方法,所述方法包括:获取样本图片,按照预设方式对所述样本图片进行处理后形成样本训练集;对预先设置的多目标卷积神经网络进行参数初始化,以及将所述样本训练集中的样本图片在所述参数初始化后的多目标卷积神经网络中进行训练,得到图片风格识别模型;利用所述图片风格识别模型对待识别图片进行识别,获取所述待识别图片属于不同风格类型的概率向量,所述概率向量中每个风格类型的概率值的取值范围为0至1;根据预先设置的判断规则和所述概率向量识别所述待识别图片所属的风格类型。一种图片风格识别装置,所述装置包括:训练集构建模块,用于获取样本图片,以及按照预设方式对所述样本图进行处理形成样本训练集;样本训练模块,用于存储设置的多目标卷积神经网络;还用于对所述多目标卷积神经网络进行参数初始化,以及将所述样本训练集中的样本图片在所述参数初始化后的多目标卷积神经网络中进行训练,得到图片风格识别模型;图片识别模块,用于利用所述图片风格识别模型对待识别图片进行识别,获取所述待识别图片属于不同风格类型的概率向量,所述概率向量中每个风格类型的概率值的取值范围为0至1;风格识别模块,用于存储预先设置的图片风格判断规则,以及根据所述判断规则和所述概率向量识别所述待识别图片所属的风格类型。本申请提供的图片风格识别方法及装置,采用了利用商品的图片信息结合设置的卷积神经网络来进行商品风格的识别。具体的实施过程中可以利用样本训练集中的样本图片在预先设置的特定网络层结构的多目标卷积神经网络中进行训练,得到具有图片风格识别能力的识别模型,进而可以实现自动识别需要进行风格分类的待识别图片的风格类型。本申请提供的方法可以实现商品风格自动快速识别,降低作业人员工作强度,提高识别效率。本申请中所述的样本训练集中的样本图片可以预先经过归一化和数据扩展处理,这样可以提高识别模型的风格识别准确性和可靠性。本申请中可以根据需要预先设置风格判断规则,再基于识别模型输出的概率向量,合理、有效、准确的识别出商品图片所属的风格类型。利用本申请实施方案,不仅可以大大提高图片风格识别准确率,降低作业人员的工作强度,还可以为用户提供准确的款式导购以及为商户提供准确的商品风格分类,可以改善用户体验,增加商品成交转化率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请提供的图片风格识别方法一种实施例的方法流程图;图2是本申请对服装样本图片进行裁剪的实施过程示意图;图3是本申请提供的预先设置的多目标卷积神经网络一种实施例的模型结构示意图;图4是本申请一种应用场景中第一卷积层学习到的64个高斯卷积核的可视化效果示意图;图5是本申请所述服装风格识别装置一种实施例的模块结构示意图;图6是本申请提供的所述样本训练模块中多目标卷积神经网络一种实施例的模型结构示意图;图7是本申请提供的所述风格识别模块一种实施例的模块结构示意图;图8是本申请提供的所述训练集构建模块一种实施例的模块结构示意图;图9是本申请提供的所述训练集构建模块另一种实施例的模块结构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。下面结合附图对本申请所述的图片风格识别方法及装置进行详细的说明。图1是本申请提出的图片风格识别方法的一种实施例的方法流程图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块结构。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本申请实施例提供的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。本申请可以从商品的图片信息出发,对商品的图片信息进行特征提取,然后以每个风格为维度结合分类器进行分类。分类器可以对商品图片属于各个风格类型的可能性进行判断,得到相应的概率值。本申请方法可以结合每个风格得到的概率值对该商品可能属于的风格类型进行输出,从而识别出商品所属的风格类型。本申请可以以服装商品识别为例进行方案的具体说明,当然,本申请所述的图片风格识别技术方案不仅可以用于男装、女装、内衣等服装类图片风格类型的识别,同样可以适用于包括本文档来自技高网
...
一种图片风格识别方法及装置

【技术保护点】
一种图片风格识别方法,其特征在于,所述方法包括:获取样本图片,按照预设方式对所述样本图片进行处理后形成样本训练集;对预先设置的多目标卷积神经网络进行参数初始化,以及将所述样本训练集中的样本图片在所述参数初始化后的多目标卷积神经网络中进行训练,得到图片风格识别模型;利用所述图片风格识别模型对待识别图片进行识别,获取所述待识别图片属于不同风格类型的概率向量,所述概率向量中每个风格类型的概率值的取值范围为0至1;根据预先设置的判断规则和所述概率向量识别所述待识别图片所属的风格类型。

【技术特征摘要】
1.一种图片风格识别方法,其特征在于,所述方法包括:获取样本图片,按照预设方式对所述样本图片进行处理后形成样本训练集;对预先设置的多目标卷积神经网络进行参数初始化,以及将所述样本训练集中的样本图片在所述参数初始化后的多目标卷积神经网络中进行训练,得到图片风格识别模型;利用所述图片风格识别模型对待识别图片进行识别,获取所述待识别图片属于不同风格类型的概率向量,所述概率向量中每个风格类型的概率值的取值范围为0至1;根据预先设置的判断规则和所述概率向量识别所述待识别图片所属的风格类型。2.如权利要求1所述的一种图片风格识别方法,其特征在于,所述预先设置的多目标卷积神经网络被设置成,包括:三层卷积层、两层全连通层、三层RELU层、三层Maxpooling层、包括至少两个Softmax子层的Softmax层。3.如权利要求2所述的一种图片风格识别方法,其特征在于,所述预先设置的多目标卷积神经网络被设置成,包括:所述Softmax层的Softmax子层将判断得到的损失值向后传播至与所述Softmax子层连接的全连通层,所述全连通层根据接收到的所述损失值相应的调整所述全连通层的参数。4.如权利要求2所述的一种图片风格识别方法,其特征在于,所述预先设置的多目标卷积神经网络被设置成,包括:包括64个卷积核的第一高斯卷积层;与所述第一高斯卷积层相连的第一Maxpooling层、RELU层、归一化层;与所述第一Maxpooling层相连的包括32个卷积核的第二高斯卷积层;与所述第二斯卷积层相连的第二Maxpooling层、RELU层、归一化层;与所述第二Maxpooling层相连的包括16个卷积核的第三高斯卷积层;与所述第三斯卷积层相连的第三Maxpooling层、RELU层、归一化层;所述第三Maxpooling层相连的第一全连通层;与所述第一全连通层相连的第二全连通层和Dropout层;与所述第二全连通层相连的包括N个Softmax子层的Softmax层,N≥2。5.如权利要求1所述的一种图片风格识别方法,其特征在于,所述根据预先设置的判断规则和所述概率向量识别所述待识别图片所属的风格类型,包括:从所述概率向量中选取概率值最大的前M个概率值,1≤M<N,N为所述概率向量中概率值的个数;以及,若所述M个概率值均大于等于第一阈值,则判断所述待识别图片属于所述M个概率值所对应的风格类型;若所述M个概率值均小于所述第一阈值,且所述M个概率值中最大的概率值大于等于第二阈值,则判断所述待识别图片属于所述M个概率值中最大的概率值所对应的风格类型;若所述M个概率值均小于第二阈值,且所述M个概率值中最小的概率值大于等于第三阈值,则判断所述待识别图片中属于所述M个概率值所对应的风格类型;若所述M个概率值均小于第二阈值,且所述M个概率值中存在至少一个概率值小于第三阈值以及至少一个概率值大于等于第三阈值,则判断所述待识别图片属于所述M个概率值中大于等于第三阈值的概率值所对应的风格类型;若所述M个概率值均小于第三阈值,则判断所述待识别图片属于所述M个概率值所对应的风格类型。6.如权利要求5所述的一种图片风格识别方法,其特征在于,采用下述中的至少一种设置方式识别所述待识别图片所属的风格类型:M取值为3;所述第一阈值取值范围包括:0.9至0.95;所述第二阈值取值包括:0.4至0.6;所述第三阈值取值包括:0.2至0.3。7.如权利要求1所述的一种图片风格识别方法,其特征在于,所述按照预设方式对所述样本图片进行处理包括:将所述样本图片的颜色信息转换为RGB三通道颜色信息;将所述样本图片的短边缩放至第一预设值,相应的,所述样本图片的长边按照所述短边的缩放比例进行同比例缩放,形成第一样本图片;以所述第一样本图片的所述长边和短边的垂直中分线交点为中心点将所述第一样本图片裁剪为边长为所述第一预设值的正方形样本图片。8.如权利要求7所述的一种图片风格识别方法,其特征在于,所述方法还包括:分别以所述边长为所述第一预设值的正方形样本图片的左上角、右上角、左下角、右下角、左边中部、右边中部、上边中部、下边中部为边界裁剪出边长为第二预设值的正方形样本图片,以所述边长为第二预设值的正方形样本图片的一条垂边为轴做镜像翻转形成新的边长为第二预设值的正方形样本图片。9.一种图片风格识别装置,其特征在于,所述装置包括:训练集构建模块,用于获取样本图片,以及按照预设方式对所述样本图进行处理形成样本训练集;样本训练...

【专利技术属性】
技术研发人员:石克阳
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1