图像聚类方法、系统、设备及介质技术方案

技术编号:24208751 阅读:33 留言:0更新日期:2020-05-20 15:51
本发明专利技术提供一种图像聚类方法、系统、设备及介质,该方法包括:通过待搜索向量进行检索,获得与所述待搜索向量最相近的前K个向量,进而得到包含K+1个向量的小数据集;通过聚类所述小数据集获得待处理的簇,并根据所述待处理的簇获得聚类结果。本发明专利技术通过在大数据集内采用比对返回topK的方式,生成K+1个向量的小范围数据集,通过对小范围数据集聚类,大大降低了对阈值的敏感度,无累积误差,提高了聚类精度;同时,召回率高兼容性好。

Image clustering methods, systems, devices and media

【技术实现步骤摘要】
图像聚类方法、系统、设备及介质
本专利技术涉及人工智能
,特别是涉及一种图像聚类方法、系统、设备及介质。
技术介绍
目前,很多场合下均需要用到人脸聚类技术,聚类是图像处理技术中的重要内容,在图像检索任务中,常规的方法是对海量被检索图片数据集提取特征,创建索引并对待检索图片提取特征根据特征在索引中进行图像的检索。适用于安防领域,分析用户行为轨迹追踪、同行人分析、用户异常行为监控报警等。然而,现有聚类在数据量有限下图像处理效率尚可,但是对于安防领域抓拍的路人库,数据量巨大(在机场、车站等区域,每天抓拍几千万张图片,需要保存数月,累积数据量可达几十亿),采用常规聚类算法无法完成聚类或聚类时间长而无法满足实际业务需求,以及基于阈值的聚类在大数据集上也存在累积误差大等问题,因此,亟需一种能够满足大数据集(人脸库或/和人体库)的图像聚类方法。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供图像聚类方法、系统、设备及介质,用于解决现有图像聚类针对大数据集,无法满足聚类分析需求的问题。<br>为实现上述目的本文档来自技高网...

【技术保护点】
1.一种图像聚类方法,其特征在于,包括:/n通过待搜索向量进行检索,获得与所述待搜索向量最相近的前K个向量,进而得到包含K+1个向量的小数据集;/n通过聚类所述小数据集获得待处理的簇,并根据所述待处理的簇获得聚类结果。/n

【技术特征摘要】
1.一种图像聚类方法,其特征在于,包括:
通过待搜索向量进行检索,获得与所述待搜索向量最相近的前K个向量,进而得到包含K+1个向量的小数据集;
通过聚类所述小数据集获得待处理的簇,并根据所述待处理的簇获得聚类结果。


2.根据权利要求1所述的图像聚类方法,其特征在于,若所述待搜索向量为一个,则从所述待处理的簇中选择包含所述待搜索向量的簇,作为目标聚类簇。


3.根据权利要求1所述的图像聚类方法,其特征在于,当获取到多个待搜索量时,利用1:N比对思路批量检索与各个所述待搜索向量最相近的前K个向量,得到多个包含K+1个向量的小数据集,其中,N代表向量数据库中向量总个数,K代表与当前待搜索向量最相似的头部向量个数。


4.根据权利要求1或3所述的图像聚类方法,其特征在于,若所述待搜索向量为多个,则从所述待处理的簇中选择包含所述待搜索向量的簇,作为目标聚类簇;
若多个所述目标聚类簇存在重复的向量,则判断所述目标聚类簇所对应的搜索向量是否为同一对象,如果是,则将多个所述目标聚类簇进行合并,其中,重复的向量保留一个。


5.根据权利要求1所述的图像聚类方法,其特征在于,所述通过待搜索向量进行检索之前,还包括:
获取图像,提取所述图像中的特征向量,将所述特征向量导入向量数据库并形成索引。


6.根据权利要求5所述的图像聚类方法,其特征在于,所述获取图像,提取所述图像中的特征向量,将所述特征向量导入向量数据库并形成索引的步骤,包括:
获取人体图像,利用人体识别算法提取所述人体图像中的人体特征得到人体特征向量;将所述人体特征向量导入向量数据库并形成索引。


7.根据权利要求5所述的图像聚类方法,其特征在于,所述获取图像,提取所述图像中的特征向量,将所述特征向量导入向量数据库并形成索引的步骤,包括:
获取人脸图像,利用人脸识别算法提取所述人脸图像中的人脸特征得到人脸特征向量;将所述人脸特征向量导入向量数据库并形成索引。


8.根据权利要求5所述的图像聚类方法,其特征在于,所述向量数据库支持批量检索。


9.根据权利要求5所述的图像聚类方法,其特征在于,所述将所述特征向量导入向量数据库并形成索引的步骤之前,还包括:
提取所述特征向量关于人脸特征或人体特征的有效向量维度,将所述有效向量维度关联存储到向量数据库。


10.一种图像聚类系统,其特征在于,包括:
数据集生成模块,用于通过待搜索向量进行检索,获得与所述待搜索向量最相近的前K个向量,进而得到包含K+1个向量的小数据集;
聚类模块,用于通过聚类所述...

【专利技术属性】
技术研发人员:周曦姚志强石立娟马鲜艳龚伟杰邹锦富徐友德杨杰张彦斌彭健姜迅
申请(专利权)人:重庆中科云从科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1