一种图片筛选方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:18350516 阅读:79 留言:0更新日期:2018-07-01 23:47
本发明专利技术公开了一种图片筛选方法及装置、存储介质、计算机设备,所述方法包括:获取第一图片集合;提取所述第一图片集合中的各个图片的特征向量;基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组;确定各组图片对应的聚类中心,并确定所述各组图片对应的聚类中心与参考中心的距离;基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合。

【技术实现步骤摘要】
一种图片筛选方法及装置、存储介质、计算机设备
本专利技术涉及图片处理技术,尤其涉及一种图片筛选方法及装置、存储介质、计算机设备。
技术介绍
随着人工智能以及大数据技术的快速发展,越来越多的产品开始向智能化发展,较之非智能化产品,智能化产品多有功能更加强大,用户体验更加舒适等特点。数据是智能化产品及其应用的基础,因此,挖掘出准确的数据对于智能化产品及其应用而言,具有重要的意义。图片是大数据技术中的一类重要数据类型,然而,由于互联网上的图片数量巨大且种类繁多,因此用户从互联网上爬取需要的图片时,往往会爬到一些垃圾图片,严重影响了人工智能的应用,基于此,如何识别出这些垃圾图片是亟待解决的问题。
技术实现思路
为解决上述技术问题,本专利技术实施例提供了一种图片筛选方法及装置、存储介质、计算机设备。本专利技术实施例提供的图片筛选方法,包括:获取第一图片集合;提取所述第一图片集合中的各个图片的特征向量;基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组;确定各组图片对应的聚类中心,并确定所述各组图片对应的聚类中心与参考中心的距离;基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合。本专利技术实施例中,所述基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组,包括:对所述第一图片集合中的各个图片的特征向量进行聚类,并基于聚类结果对所述第一图片集合中的各个图片进行分组。本专利技术实施例中,所述对所述第一图片集合中的各个图片的特征向量进行聚类,并基于聚类结果对所述第一图片集合中的各个图片进行分组,包括:设置聚类中心的个数为N,N为正整数;基于所述聚类中心的个数,对所述第一图片集合中的各个图片的特征向量进行聚类;基于聚类结果将所述第一图片集合中的各个图片划分为N组。本专利技术实施例中,所述确定各组图片对应的聚类中心,包括:基于所述聚类结果,确定各组图片对应的聚类中心。本专利技术实施例中,所述方法还包括:基于所述各组图片对应的聚类中心,计算所述参考中心。本专利技术实施例中,所述基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合,包括:将聚类中心相对于所述参考中心的距离大于等于预设阈值的一组或多组图片,从所述第一图片集合中删除,得到第二图片集合。本专利技术实施例中,所述基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合,包括:对所述各组图片对应的聚类中心与参考中心的距离由大到小进行排序,并确定出距离最大的M组图片,M为正整数;从所述第一图片集合中删除所述M组图片,得到第二图片集合。本专利技术实施例提供的图片筛选装置,包括:获取单元,用于获取第一图片集合;提取单元,用于提取所述第一图片集合中的各个图片的特征向量;分组单元,用于基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组;距离确定单元,用于确定各组图片对应的聚类中心,并确定所述各组图片对应的聚类中心与参考中心的距离;筛选单元,用于基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合。本专利技术实施例中,所述分组单元,具体用于:对所述第一图片集合中的各个图片的特征向量进行聚类,并基于聚类结果对所述第一图片集合中的各个图片进行分组。本专利技术实施例中,所述分组单元包括:设置子单元,用于设置聚类中心的个数为N,N为正整数;聚类子单元,用于基于所述聚类中心的个数,对所述第一图片集合中的各个图片的特征向量进行聚类;划分子单元,用于基于聚类结果将所述第一图片集合中的各个图片划分为N组。本专利技术实施例中,所述分组单元,还用于:基于所述聚类结果,确定各组图片对应的聚类中心。本专利技术实施例中,所述装置还包括:参考中心计算单元,用于基于所述各组图片对应的聚类中心,计算所述参考中心。本专利技术实施例中,所述筛选单元,具体用于:将聚类中心相对于所述参考中心的距离大于等于预设阈值的一组或多组图片,从所述第一图片集合中删除,得到第二图片集合。本专利技术实施例中,所述筛选单元,具体用于:对所述各组图片对应的聚类中心与参考中心的距离由大到小进行排序,并确定出距离最大的M组图片,M为正整数;从所述第一图片集合中删除所述M组图片,得到第二图片集合。本专利技术实施例提供的存储介质,其上存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述的图片筛选方法。本专利技术实施例提供的计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可执行指令,其特征在于,所述处理器执行所述计算机可执行指令时实现上述的图片筛选方法。本专利技术实施例的技术方案中,获取第一图片集合;提取所述第一图片集合中的各个图片的特征向量;基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组;确定各组图片对应的聚类中心,并确定所述各组图片对应的聚类中心与参考中心的距离;基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合。采用本专利技术实施例的技术方案,首先,利用计算机视觉技术对爬取到的第一图片集合进行处理,得到第一图片集合中的各个图片的特征向量,然后,利用聚类算法对特征向量进行聚类处理,从而实现对第一图片集合中的各个图片进行分组,最后,自动清理第一图片集合中的垃圾图片,从而实现了图片的自动清洗,为人工智能的应用提供了精确的图片数据来源。附图说明图1为本专利技术实施例中进行信息交互的各方硬件实体的示意图;图2为本专利技术实施例的图片筛选方法的流程示意图一;图3为本专利技术实施例的图片筛选方法的流程示意图二;图4为本专利技术实施例的图片筛选方法的流程示意图三;图5为本专利技术实施例的图片筛选方法的流程示意图四;图6为本专利技术实施例的图片筛选装置的结构组成示意图一;图7为本专利技术实施例的图片筛选装置的结构组成示意图二;图8为本专利技术实施例的计算机设备的结构组成示意图。具体实施方式为了能够更加详尽地了解本专利技术实施例的特点与
技术实现思路
,下面结合附图对本专利技术实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本专利技术实施例。图1为本专利技术实施例中进行信息交互的各方硬件实体的示意图,图1中包括:图片筛选装置、服务器1-服务器n,其中,图片筛选装置通过有线网络或者无线网络与服务器进行信息交互。一个示例中,图片筛选装置设置于终端中,终端的类型例如是手机、台式机、PC机、一体机等类型;终端至少提供如下两种功能:1)为用户提供用户界面(UI,Interface);2)从服务器1-服务器n爬取图片并执行图片筛选的处理过程。另一个示例中,图片筛选装置设置于服务器中,该服务器提供如下功能:从服务器1-服务器n爬取图片并执行图片筛选的处理过程;此外,该服务器可以与面向用户的客户端进行信息交互,以接收用户的请求实现爬取图片并执行图片筛选的处理过程,还可以向用户的客户端发送图片筛选结果等数据,而客户端负责为用户提供UI。上述图1的例子只是实现本专利技术实施例的一个系统架构实例,本专利技术实施例本文档来自技高网
...
一种图片筛选方法及装置、存储介质、计算机设备

【技术保护点】
1.一种图片筛选方法,其特征在于,所述方法包括:获取第一图片集合;提取所述第一图片集合中的各个图片的特征向量;基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组;确定各组图片对应的聚类中心,并确定所述各组图片对应的聚类中心与参考中心的距离;基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合。

【技术特征摘要】
1.一种图片筛选方法,其特征在于,所述方法包括:获取第一图片集合;提取所述第一图片集合中的各个图片的特征向量;基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组;确定各组图片对应的聚类中心,并确定所述各组图片对应的聚类中心与参考中心的距离;基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合。2.根据权利要求1所述的图片筛选方法,其特征在于,所述基于所述第一图片集合中的各个图片的特征向量,对所述第一图片集合中的各个图片进行分组,包括:对所述第一图片集合中的各个图片的特征向量进行聚类,并基于聚类结果对所述第一图片集合中的各个图片进行分组。3.根据权利要求2所述的图片筛选方法,其特征在于,所述对所述第一图片集合中的各个图片的特征向量进行聚类,并基于聚类结果对所述第一图片集合中的各个图片进行分组,包括:设置聚类中心的个数为N,N为正整数;基于所述聚类中心的个数,对所述第一图片集合中的各个图片的特征向量进行聚类;基于聚类结果将所述第一图片集合中的各个图片划分为N组。4.根据权利要求2或3所述的图片筛选方法,其特征在于,所述确定各组图片对应的聚类中心,包括:基于所述聚类结果,确定各组图片对应的聚类中心。5.根据权利要求4所述的图片筛选方法,其特征在于,所述方法还包括:基于所述各组图片对应的聚类中心,计算所述参考中心。6.根据权利要求1所述的图片筛选方法,其特征在于,所述基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合,包括:将聚类中心相对于所述参考中心的距离大于等于预设阈值的一组或多组图片,从所述第一图片集合中删除,得到第二图片集合。7.根据权利要求1所述的图片筛选方法,其特征在于,所述基于所述各组图片对应的聚类中心与参考中心的距离,从所述第一图片集合中删除满足预设条件的一组或多组图片,得到第二图片集合,包括:对所述各组图片对应的聚类中心与参考中心的距离由大到小进行排序,并确定出距离最大的M组图片,M为正整数;从所述第一图片集合中删除所述M组图片,得到第二图片集合。8.一种图片筛选装置,其特征在于,所述...

【专利技术属性】
技术研发人员:刁梁陈昕周华朱欤
申请(专利权)人:美的集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1