【技术实现步骤摘要】
一种重图识别方法和装置
本专利技术涉及计算机
,尤其涉及一种重图识别方法和装置。
技术介绍
电商平台中同一物品可能在多家店铺售卖,其中可能存在盗图后的简单修改。从图片角度区分两个店铺所售卖是否为同一物品或近似物品,对于电商运营中的物品维权有很大的意义。基于人工查找相同物品耗费人力、时间成本较高,由此现有主要利用多层卷积方式对图片进行主体识别,以确定要匹配的物品在图片中的位置,然后提取该位置处图片的特征向量,以此计算不同图片的相似度。但实现本专利技术的过程中,专利技术人发现现有技术至少存在如下问题:采用的多层卷积方式耗费资源量较大,且需在GPU(GraphicsProcessingUnit,图形处理器)服务器上运行,而GPU服务器价格昂贵,且复用率低;需要进行图片标注和机器学习,对于新类型的图片需要重新标注和训练,影响图片处理速度。
技术实现思路
有鉴于此,本专利技术实施例提供一种重图识别方法和装置,至少能够解决现有算法准确率低、耗费资源多、处理新分类速度慢的问题。为实 ...
【技术保护点】
1.一种重图识别方法,其特征在于,包括:/n确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;/n根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;/n基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。/n
【技术特征摘要】
1.一种重图识别方法,其特征在于,包括:
确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;
根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;
基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。
2.根据权利要求1所述的方法,其特征在于,在所述确定图片对之前,还包括:
接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;
根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;
判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;
根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;
提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。
3.根据权利要求2所述的方法,其特征在于,在所述对所述图片集中各个图片进行灰度处理之前,还包括:
获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。
4.根据权利要求1所述的方法,其特征在于,在所述基于与各个图片对应的像素带,确定所述图片对的重合像素带之前,包括:
获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;
根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;
组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合。
5.根据权利要求1所述的方法,其特征在于,所述根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比,包括:
统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到...
【专利技术属性】
技术研发人员:赵墨农,亢维盼,
申请(专利权)人:北京沃东天骏信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。