The present application provides a picture style identification method and apparatus. The method comprises: obtaining sample images, form the training set for processing the sample image according to a preset mode; the multi-objective convolutional neural network preset parameter initialization and the sample training set for training sample images in multiple target convolutional neural network parameters initialization after get the picture style recognition model; use the picture style recognition model to recognize image recognition, acquisition probability vector to identify pictures belonging to different styles, each style of probability probability vector values in the range of 0 to 1; according to the style preset judgment rule and probability vector recognition to identify the picture. By using the technical scheme provided by the embodiment of the application, can be achieved on the product picture style recognition automatically and accurately, can improve the picture style recognition efficiency, reduce the work intensity of workers, improve the user experience.
【技术实现步骤摘要】
一种图片风格识别方法及装置
本申请属于图像信息处理
,尤其涉及一种图片风格识别方法及装置。
技术介绍
随着互联网消费时代的发展,消费者可以线上挑选自己喜爱的商品,极大的方便了用户购物。例如消费者可以通过线上商家展示的商品图片选取自己喜欢的商品种类。一般的,消费者在线上购买商品时往往会受到多种概念因素的影响,例如比如品牌、价格、颜色、风格类型等,这些概念因素一般可以由商家在服务操作平台进行人工设置。在众多概念因素中,一些例如服装的品牌、价格、色彩等因素通常是容易定义,且一般有着相对明确、规范的界限进行区分。而对于其他一些商品的概念如服装风格,由于概念的语义性较强,受个人主观判断影响严重等,导致不同的商家或消费者对具体的某一件服装风格定义上出现较大偏差。例如有的消费者会认为服装上包含了字母“ROCK”的应该是街头风格,有的消费者则会认为服装上有铆钉等元素的是街头风格。而对于服装设计者来说,可能综合了各种各样的元素来组成最后的成品,其中可能包含了街头的元素,也可能有民族或文艺的元素。经过一些实际应用数据分析,发现约有15%的消费者在购买服装类商品时,会结合风格关键词进行商品搜索,这个比例仅仅落后于服装的品牌和类目两个因素。可见商品风格类型这个因素对于线上商品导购起到非常重要的作用。然而,无论是商家还是消费者会在判断填写商品所属的风格类型时往往会因为出现主观因素影响出现较大偏差,因此类似这样商品风格类型的概念在商家和消费者中常常产生混淆和歧义,影响商家商品的风格分类或者消费者商品风格的筛选,降低商品营销效果。这样不仅影响成交转化率,也降低了用户体验。同时,由 ...
【技术保护点】
一种图片风格识别方法,其特征在于,所述方法包括:获取样本图片,按照预设方式对所述样本图片进行处理后形成样本训练集;对预先设置的多目标卷积神经网络进行参数初始化,以及将所述样本训练集中的样本图片在所述参数初始化后的多目标卷积神经网络中进行训练,得到图片风格识别模型;利用所述图片风格识别模型对待识别图片进行识别,获取所述待识别图片属于不同风格类型的概率向量,所述概率向量中每个风格类型的概率值的取值范围为0至1;根据预先设置的判断规则和所述概率向量识别所述待识别图片所属的风格类型。
【技术特征摘要】
1.一种图片风格识别方法,其特征在于,所述方法包括:获取样本图片,按照预设方式对所述样本图片进行处理后形成样本训练集;对预先设置的多目标卷积神经网络进行参数初始化,以及将所述样本训练集中的样本图片在所述参数初始化后的多目标卷积神经网络中进行训练,得到图片风格识别模型;利用所述图片风格识别模型对待识别图片进行识别,获取所述待识别图片属于不同风格类型的概率向量,所述概率向量中每个风格类型的概率值的取值范围为0至1;根据预先设置的判断规则和所述概率向量识别所述待识别图片所属的风格类型。2.如权利要求1所述的一种图片风格识别方法,其特征在于,所述预先设置的多目标卷积神经网络被设置成,包括:三层卷积层、两层全连通层、三层RELU层、三层Maxpooling层、包括至少两个Softmax子层的Softmax层。3.如权利要求2所述的一种图片风格识别方法,其特征在于,所述预先设置的多目标卷积神经网络被设置成,包括:所述Softmax层的Softmax子层将判断得到的损失值向后传播至与所述Softmax子层连接的全连通层,所述全连通层根据接收到的所述损失值相应的调整所述全连通层的参数。4.如权利要求2所述的一种图片风格识别方法,其特征在于,所述预先设置的多目标卷积神经网络被设置成,包括:包括64个卷积核的第一高斯卷积层;与所述第一高斯卷积层相连的第一Maxpooling层、RELU层、归一化层;与所述第一Maxpooling层相连的包括32个卷积核的第二高斯卷积层;与所述第二斯卷积层相连的第二Maxpooling层、RELU层、归一化层;与所述第二Maxpooling层相连的包括16个卷积核的第三高斯卷积层;与所述第三斯卷积层相连的第三Maxpooling层、RELU层、归一化层;所述第三Maxpooling层相连的第一全连通层;与所述第一全连通层相连的第二全连通层和Dropout层;与所述第二全连通层相连的包括N个Softmax子层的Softmax层,N≥2。5.如权利要求1所述的一种图片风格识别方法,其特征在于,所述根据预先设置的判断规则和所述概率向量识别所述待识别图片所属的风格类型,包括:从所述概率向量中选取概率值最大的前M个概率值,1≤M<N,N为所述概率向量中概率值的个数;以及,若所述M个概率值均大于等于第一阈值,则判断所述待识别图片属于所述M个概率值所对应的风格类型;若所述M个概率值均小于所述第一阈值,且所述M个概率值中最大的概率值大于等于第二阈值,则判断所述待识别图片属于所述M个概率值中最大的概率值所对应的风格类型;若所述M个概率值均小于第二阈值,且所述M个概率值中最小的概率值大于等于第三阈值,则判断所述待识别图片中属于所述M个概率值所对应的风格类型;若所述M个概率值均小于第二阈值,且所述M个概率值中存在至少一个概率值小于第三阈值以及至少一个概率值大于等于第三阈值,则判断所述待识别图片属于所述M个概率值中大于等于第三阈值的概率值所对应的风格类型;若所述M个概率值均小于第三阈值,则判断所述待识别图片属于所述M个概率值所对应的风格类型。6.如权利要求5所述的一种图片风格识别方法,其特征在于,采用下述中的至少一种设置方式识别所述待识别图片所属的风格类型:M取值为3;所述第一阈值取值范围包括:0.9至0.95;所述第二阈值取值包括:0.4至0.6;所述第三阈值取值包括:0.2至0.3。7.如权利要求1所述的一种图片风格识别方法,其特征在于,所述按照预设方式对所述样本图片进行处理包括:将所述样本图片的颜色信息转换为RGB三通道颜色信息;将所述样本图片的短边缩放至第一预设值,相应的,所述样本图片的长边按照所述短边的缩放比例进行同比例缩放,形成第一样本图片;以所述第一样本图片的所述长边和短边的垂直中分线交点为中心点将所述第一样本图片裁剪为边长为所述第一预设值的正方形样本图片。8.如权利要求7所述的一种图片风格识别方法,其特征在于,所述方法还包括:分别以所述边长为所述第一预设值的正方形样本图片的左上角、右上角、左下角、右下角、左边中部、右边中部、上边中部、下边中部为边界裁剪出边长为第二预设值的正方形样本图片,以所述边长为第二预设值的正方形样本图片的一条垂边为轴做镜像翻转形成新的边长为第二预设值的正方形样本图片。9.一种图片风格识别装置,其特征在于,所述装置包括:训练集构建模块,用于获取样本图片,以及按照预设方式对所述样本图进行处理形成样本训练集;样本训练...
【专利技术属性】
技术研发人员:石克阳,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。