图像处理方法及装置制造方法及图纸

技术编号:21091029 阅读:19 留言:0更新日期:2019-05-11 10:29
本申请公开了一种图像处理方法及装置。其中,该方法包括:确定与第一特征向量对应的第一聚类中心;第一特征向量为查询样本的特征向量,第一聚类中心为根据第一特征向量与第二聚类中心的乘积量化距离得到,第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,第二特征向量为样本库的特征向量;计算第一聚类中心第二聚类中心的汉明距离;根据汉明距离从样本库中确定出与查询样本相似度高的样本集合;根据第一特征向量与第三特征向量的乘积量化距离从样本集合中确定出目标样本;目标样本为与查询样本相似度最高的样本,第三特征向量为样本集合中每个样本的特征向量。采用本申请,可提高查询样本的查询效率。

【技术实现步骤摘要】
图像处理方法及装置
本申请涉及计算机
,尤其涉及一种图像处理方法及装置。
技术介绍
随着大数据的发展,如何从海量的库样本中筛选出与查询样本相似的图像亟待解决。一般地,可通过乘积量化(productquantization,PQ)方法,具体的,可将样本图像的特征空间分解为多个低维子空间的笛卡尔乘积,然后单独地对每一个子空间进行量化。更具体的,在训练阶段,每一个子空间经过聚类后可得到k个聚类中心,所有子空间的聚类中心的笛卡尔乘积构成了一个对全空间的密集划分。经过量化学习后,对于给定的查询样本,通过查表的方式可以计算出查询样本和库中样本的非对称距离,从而可得到与查询样本相似的图像。然而,上述所示的方法计算量非常大,查询效率低下。
技术实现思路
本申请提供了一种图像处理方法及装置,可有效提高样本的查询效率。第一方面,本申请实施例提供了一种图像处理方法,包括:确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;计算所述第一聚类中心与所述第二聚类中心的汉明距离;根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。本申请实施例中,通过计算查询样本和样本库中第二聚类中心的乘积量化距离,可以将该查询样本归到与样本库中与其距离最近的第一聚类中心;然后通过计算上述第一聚类中心和上述第二聚类中心的汉明距离,可以得到上述样本库中与上述查询样本相似度高的样本集合;进一步通过计算该查询样本与上述样本集合的第三特征向量的乘积量化距离,可确定出与上述查询样本相似度最高的目标样本。实施本申请实施例,由于汉明距离的计算方式简单、高效,因此通过汉明距离可以快速的确定上述样本集合,实现对整个样本库的快速过滤;进一步通过计算上述查询样本与上述样本集合的乘积量化距离(如非对称距离)来确定目标样本,可避免计算查询样本与整个样本库中每个样本的乘积量化距离,大大的减少了计算量,提高了查询效率。在一种可能的实现方式中,根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合,包括:根据所述第一聚类中心与所述第二聚类中心的汉明距离,获得所述查询样本与所述样本库中每个样本的汉明距离集合;根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,所述参考相似值用于表示所述查询样本与所述样本库中每个样本的相似程度;根据所述参考相似值从所述样本库中确定出与所述查询样本相似度高的样本集合。本申请实施例中,通过上述汉明距离集合可以确定上述查询样本与上述样本库中每个样本的参考相似值,该参考相似值可表示查询样本与样本库中每个样本的相似程度(如汉明距离越小则表示参考相似值越高),从而通过上述方式即汉明距离值的大小可直观的反映参考相似值的大小,从而快速的确定上述样本集合,提高查询效率。在一种可能的实现方式中,所述根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,包括:将所述汉明距离集合中所包含的汉明距离的和确定为所述查询样本与所述样本库中每个样本的参考相似值。本申请实施例中,通过汉明距离集合中所包含的汉明距离的和来确定参考相似值,不仅可准确的表示上述参考相似值,而且简单高效。在一种可能的实现方式中,所述计算所述第一聚类中心与所述第二聚类中心的汉明距离之前,所述方法还包括:对所述第二聚类中心进行编码,得到所述第二聚类中心的乘积量化码;根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码。本申请实施例中,通过第二聚类中心的乘积量化码来得到该第二聚类中心的汉明码,不仅使得该第二聚类中心的汉明码具有索引编码的意义,还具有汉明码的意义,从而可使得图像处理装置能够得到第二聚类中心与第一聚类中心的汉明距离,进而有效提高了计算速度。在一种可能的实现方式中,根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码,包括:确定所述第二聚类中心的转换码;计算所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的乘积量化距离,以及所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的汉明距离;根据所述乘积量化距离以及所述汉明距离,确定所述第二聚类中心的转换码为所述第二聚类中心的汉明码。本申请实施例中,通过上述第二聚类中心的乘积量化码与上述第二聚类中心的转换码的乘积量化距离以及汉明距离可以确定上述汉明码,通过上述方式可以使上述乘积量化码具有汉明码的意义。在一种可能的实现方式中,所述计算所述第一聚类中心与第二聚类中心的汉明距离,包括:根据所述第一聚类中心的汉明码与所述第二聚类中的汉明码,计算所述第一聚类中心与所述第二聚类中心的汉明距离。本申请实施例中,通过上述第一聚类中心和上述第二聚类中心的汉明码来计算汉明距离,可以使汉明距离的计算更加高效,提高了计算速度,提高了确定与查询样本最相似的样本的效率。第二方面,本申请实施例提供了一种图像处理装置,包括:第一确定单元,用于确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;计算单元,用于计算所述第一聚类中心与所述第二聚类中心的汉明距离;第二确定单元,用于根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;第三确定单元,用于根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。在一种可能的实现方式中,所述第二确定单元包括:第一确定子单元,根据所述第一聚类中心与所述第二聚类中心的汉明距离,获得所述查询样本与所述样本库中每个样本的汉明距离集合;第二确定子单元,用于根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,所述参考相似值用于表示所述查询样本与所述样本库中每个样本的相似程度;第三确定子单元,用于根据所述参考相似值从所述样本库中确定出与所述查询样本相似度高的样本集合。在一种可能的实现方式中,所述第二确定子单元,具体用于将所述汉明距离集合中所包含的汉明距离的和确定为所述查询样本与所述样本库中每个样本的参考相似值。在一种可能的实现方式中,所述装置还包括:第一编码单元,本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;计算所述第一聚类中心与所述第二聚类中心的汉明距离;根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;计算所述第一聚类中心与所述第二聚类中心的汉明距离;根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。2.根据权利要求1所述的方法,其特征在于,根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合,包括:根据所述第一聚类中心与所述第二聚类中心的汉明距离,获得所述查询样本与所述样本库中每个样本的汉明距离集合;根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,所述参考相似值用于表示所述查询样本与所述样本库中每个样本的相似程度;根据所述参考相似值从所述样本库中确定出与所述查询样本相似度高的样本集合。3.根据权利要求2所述的方法,其特征在于,所述根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,包括:将所述汉明距离集合中所包含的汉明距离的和确定为所述查询样本与所述样本库中每个样本的参考相似值。4.根据权利要求1-3任一项所述的方法,其特征在于,所述计算所述第一聚类中心与所述第二聚类中心的汉明距离之前,所述方法还包括:对所述第二聚类中心进行编码,得到所述第二聚类中心的乘积量化码;根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码。5.根据权利要求4所述的方法,其特征在于,根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码,包括:确定所述第二聚类中心的转换码;计算所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的乘积量化距离,以及所述第二聚类中心的...

【专利技术属性】
技术研发人员:戴世稳钟斌
申请(专利权)人:深圳云天励飞技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1