当前位置: 首页 > 专利查询>北京大学专利>正文

获取紧凑全局特征描述子的码流的方法技术

技术编号:11467113 阅读:111 留言:0更新日期:2015-05-17 22:26
本发明专利技术提供一种获取紧凑全局特征描述子的码流的方法,其中,所述方法包括:获取待处理图像的紧凑全局特征描述子;构造所述紧凑全局特征描述子的码流,所述码流包括:所述码流头部和所述码流主体;所述码流头部用于标识构成所述码流的所述紧凑全局特征描述子的构成方式,所述码流主体用于标识所述紧凑全局特征描述子中所有比特的值。上述获取紧凑全局特征描述子的码流的方法能够提高紧凑全局特征描述子的表达能力,进而提高图像检索的准确率和检索效率。

【技术实现步骤摘要】
获取紧凑全局特征描述子的码流的方法
本专利技术涉及计算机技术,尤其涉及一种获取紧凑全局特征描述子的码流的方法。
技术介绍
在图像检索领域,业内人士通过将图像的局部特征描述子聚合成全局特征描述子,进而实现图像的检索。当前,FisherVector(简称FV向量)为一种全局特征描述子,且FisherVector在图像检索和分类中都获得了比较好的性能。通过对Fisher向量中高斯成分的灵活选择以及后续的符号二值化操作,能够使得Fisher向量转化为可伸缩的紧凑全局特征描述子,使其较好的满足移动视觉搜索的对于速度和精度的需求。在图像检索过程中,为了降低可伸缩的全局特征描述子的存储复杂度,以及传输过程中的带宽延迟,需要采用码表将可伸缩的全局特征描述子压缩。现有技术中对可伸缩的全局特征描述子压缩的方法包括:使用乘积量化将可伸缩的全局特征描述子分成多个不重叠的子向量,根据码表将每个子向量量化成一个标识符。然而,上述压缩方法需要预先训练好的码表,码表会占用较大的存储空间,使内存有限的移动设备难以承受。另一方面,为将可伸缩的全局特征描述子压缩到较小的长度,量化的质量会受到影响,使可伸缩的全局特征描述子的表达能力降低,从而影响检索的性能。
技术实现思路
为解决现有技术中的缺陷,本专利技术提供一种获取紧凑全局特征描述子的码流的方法,用于提高可伸缩的全局特征描述子的表达能力,进而提高图像检索的准确率和检索效率。第一方面,本专利技术提供一种获取紧凑全局特征描述子的方法,包括:获取待处理图像的紧凑全局特征描述子;构造所述紧凑全局特征描述子的码流,所述码流包括:所述码流头部和所述码流主体;所述码流头部用于标识构成所述码流的所述紧凑全局特征描述子的构成方式,所述码流主体用于标识所述紧凑全局特征描述子中所有比特的值。可选地,所述获取待处理图像的紧凑全局特征描述子,包括:获取待处理图像的局部特征描述子;根据高斯混合模型中的每一高斯密度函数,将所述局部特征描述子转换为第一累积梯度向量和/或第二累积梯度向量;根据高斯混合模型中每个高斯密度函数对应的第一累积梯度向量的所有维度数值的标准差,对所有高斯密度函数按照所述标准差由大到小的顺序排序,选取排序中排在前面的若干个高斯密度函数,并将选取的高斯密度函数对应的第一累积梯度向量和/或第二累积梯度向量依次首尾相连得到可伸缩全局特征描述子;根据可伸缩全局特征描述子每一维度的数值,对可伸缩全局特征描述子进行二值化处理,得到紧凑全局特征描述子;其中,所述第一累积梯度向量是所述图像的对数似然函数对所述高斯密度函数对应的均值求一阶偏导得到的,所述第二累积梯度向量是所述图像的对数似然函数对所述高斯密度函数对应的方差求一阶偏导得到的;所述可伸缩全局特征描述子的字节大小根据所述预设规则中参数值的变化而变化。可选地,所述对可伸缩全局特征描述子进行二值化处理,包括:对所述选取的高斯密度函数对应的第一累积梯度向量和/或第二累积梯度向量进行二值化,得到包括比特的二值化后的第一累积梯度向量和/或第二累积梯度向量;将包括比特的二值化后的所述第一累积梯度向量和/或第二累积梯度向量依次首尾相连得到紧凑全局特征描述子。其中,若所述第一累积梯度向量和/或第二累积梯度向量的一维度的数值为正数,则该维度对应的比特的值为1;若所述第一累积梯度向量和/或第二累积梯度向量的一维度的数值为负数或0,则该维度对应的比特的值为0。可选地,每个高斯密度函数对应码流头部的一个比特,512个高斯密度函数分别对应码流头部的512个比特,码流头部还包括:第一专用比特和第二专用比特;其中,若512个比特中一个比特的值为1,则表示该比特所属的高斯密度函数对应的二值化后的第一累积梯度向量和/或第二累积梯度向量用于组成所述紧凑全局特征描述子;若512个比特中一个比特的值为0,则表示该比特所属的高斯密度函数对应的二值化后的第一累积梯度向量和/或第二累积梯度向量未用于组成所述紧凑全局特征描述子;第一专用比特的值为1,则表示采用比特选择方式对每一高斯密度函数对应的二值化后的第一累积梯度向量的比特进行选择;第一专用比特的值为0,则表示未采用比特选择方式对每一高斯密度函数对应的二值化后的第一累积梯度向量的比特进行选择;第二专用比特的值为1,则表示二值化后的第一累积梯度向量和二值化后的第二累积梯度向量均用于组成所述紧凑全局特征描述子;第二专用比特的值为0,则表示二值化后的第一累积梯度向量用于组成紧凑全局特征描述子,二值化后的第二累积梯度向量未用于组成所述紧凑全局特征描述子。可选地,在所述紧凑全局特征描述子中,二值化后的第一累积梯度向量的比特的个数为32,二值化后的第二累积梯度向量的比特的个数为32;采用比特选择方式对每一高斯密度函数对应的二值化后的第一累积梯度向量的比特进行选择,得到与该高斯密度函数对应的二值化后的第一累积梯度向量的比特的个数为24。其中,所述比特选择方式,为采用统计方式计算每一高斯密度函数对应的包括比特的二值化后的第一累积梯度向量中每一比特的重要性,并选择重要性高的比特。可选地,若所述码流头部中第一专用比特的值为1,第二专用比特的值为0,且512个比特中所述高斯密度函数对应的比特的值为1,则从所述高斯密度函数对应的二值化后的第一累积梯度向量的32个比特中选取24个比特依次连接构成码流主体;若所述码流头部中第一专用比特的值为0,第二专用比特的值为0,且512个比特中所述高斯密度函数对应的比特的值为1,则将所述高斯密度函数对应的二值化后的第一累积梯度向量的32个比特依次连接构成码流主体;若所述码流头部中第一专用比特的值为0,第二专用比特的值为1,且512个比特中所述高斯密度函数对应的比特的值为1,则将所述高斯密度函数对应的二值化后的第一累积梯度向量的32个比特和第二累积梯度向量的32个比特分别依次连接构成码流主体;若所述码流头部的512个比特中所述高斯密度函数对应的比特的值为0,则所述高斯密度函数对应的二值化后的第一累积梯度向量和/或第二累积梯度向量不用于组成码流主体。可选地,若所述待处理图像的视觉特征描述子长度范围在462字节和562字节之间,则第一专用比特的值为1,第二专用比特的值为0;若所述待处理图像的视觉特征描述子长度范围在924字节和1124字节之间,则第一专用比特的值为0,第二专用比特的值为0;若所述待处理图像的视觉特征描述子长度范围在1848字节和2248字节之间,则第一专用比特位的值0,第二专用比特的值为0;若所述待处理图像的视觉特征描述子长度范围在3696字节和4496字节之间,则第一专用比特的值为0,第二专用比特的值为1;若所述待处理图像的视觉特征描述子长度范围在7392字节和8992字节之间,则第一专用比特的值为0,第二专用比特的值为1;若所述待处理图像的视觉特征描述子长度范围在14784字节和17984字节之间,则第一专用比特的值为0,第二专用比特的值为1;所述待处理图像的视觉特征描述子由全局特征描述子、局部特征描述子和每一局部特征描述子对应待处理图像的位置信息构成。第二方面,本专利技术提供一种获取紧凑全局特征描述子的码流的装置,包括:获取单元,用于获取待处理图像的紧凑全局特征描述子;码流构造单元,用于构造所述紧凑全局特征描述子的码流,所述码流包括本文档来自技高网...
获取紧凑全局特征描述子的码流的方法

【技术保护点】
一种获取紧凑全局特征描述子的码流的方法,其特征在于,包括:获取待处理图像的紧凑全局特征描述子;构造所述紧凑全局特征描述子的码流,所述码流包括:所述码流头部和所述码流主体;所述码流头部用于标识构成所述码流的所述紧凑全局特征描述子的构成方式,所述码流主体用于标识所述紧凑全局特征描述子中所有比特的值。

【技术特征摘要】
1.一种获取紧凑全局特征描述子的码流的方法,其特征在于,包括:获取待处理图像的紧凑全局特征描述子;构造所述紧凑全局特征描述子的码流,所述码流包括:所述码流头部和所述码流主体;所述码流头部用于标识构成所述码流的所述紧凑全局特征描述子的构成方式,所述码流主体用于标识所述紧凑全局特征描述子中所有比特的值;其中,所述获取待处理图像的紧凑全局特征描述子,包括:获取待处理图像的局部特征描述子;根据高斯混合模型中的每一高斯密度函数,将所述局部特征描述子转换为第一累积梯度向量和/或第二累积梯度向量;根据高斯混合模型中每个高斯密度函数对应的第一累积梯度向量的所有维度数值的标准差,对所有高斯密度函数按照所述标准差由大到小的顺序排序,选取排序中排在前面的若干个高斯密度函数,并将选取的高斯密度函数对应的第一累积梯度向量和/或第二累积梯度向量依次首尾相连得到可伸缩全局特征描述子;根据可伸缩全局特征描述子每一维度的数值,对可伸缩全局特征描述子进行二值化处理,得到紧凑全局特征描述子;其中,所述第一累积梯度向量是所述图像的对数似然函数对所述高斯密度函数对应的均值求一阶偏导得到的,所述第二累积梯度向量是所述图像的对数似然函数对所述高斯密度函数对应的方差求一阶偏导得到的;所述可伸缩全局特征描述子的字节大小根据预设规则中参数值的变化而变化;其中,每个高斯密度函数对应码流头部的一个比特,512个高斯密度函数分别对应码流头部的512个比特,码流头部还包括:第一专用比特和第二专用比特;其中,若512个比特中一个比特的值为1,则表示该比特所属的高斯密度函数对应的二值化后的第一累积梯度向量和/或第二累积梯度向量用于组成所述紧凑全局特征描述子;若512个比特中一个比特的值为0,则表示该比特所属的高斯密度函数对应的二值化后的第一累积梯度向量和/或第二累积梯度向量未用于组成所述紧凑全局特征描述子;第一专用比特的值为1,则表示采用比特选择方式对每一高斯密度函数对应的二值化后的第一累积梯度向量的比特进行选择;第一专用比特的值为0,则表示未采用比特选择方式对每一高斯密度函数对应的二值化后的第一累积梯度向量的比特进行选择;第二专用比特的值为1,则表示二值化后的第一累积梯度向量和二值化后的第二累积梯度向量均用于组成所述紧凑全局特征描述子;第二专用比特的值为0,则表示二值化后的第一累积梯度向量用于组成紧凑全局特征描述子,二值化后的第二累积梯度向量未用于组成所述紧凑全局特征描述子;在所述紧凑全局特征描述子中,二值化后的第一累积梯度向量的比特的个数为32,二值化后的第二累积梯度向量的比特的个数为32;采用比特选择方式对每一高斯密度函数对应的二值化后的第一累积梯度向量的比特进行选择,得到与该高斯密度函数对应的二值化后的第一累积梯度向量的比特的个数为24;其中,所述比特选择方式,为采用统计方式计算每一高斯密度函数对应的包括比特的二值化后的第一累积梯度向量中每一比特的重要性,并选择重要性高的比特。2.根据权利要求1所述的方法,其特征在于,所述对可伸缩全局特征描述子进行二值化处理,包括:对所述选取的高斯密度函数对应的第一累积梯度向量和/或第二累积梯度向量进行二值化,得到包括比特的二值化后的第一累积梯度向量和/或第二累积梯度向量;将包括比特的二值化后的所述第一累积梯度向量和/或第二累积梯度向量依次首尾相连得到紧凑全局特征描述子;其中,若所述第一累积梯度向量和/或第二累积梯度向量的一维度的数值为正数,则该维度对应的比特的值为1;若所述第一累积梯度向量和/或第二累积梯度向量的一维度的数值为负数或0,则该维度对应的比特的值为0。3.根据权利要求1或2所述的方法,其特征在于,若所述码流头部中第一专用比特的值为1,第二专用比特的值为0,且512个比特中所述高斯密度函数对应的比特的值为1,则从所述高斯密度函数对应的二值化后的第一累积梯度向量的32个比特中选取24个比特依次连接构成码流主体;若所述码流头部中第一专用比特的值为0,第二专用比特的值为0,且512个比特中所述高斯密度函数对应的比特的值为1,则将所述高斯密度函数对应的二值化后的第一累积梯度向量的32个比特依次连接构成码流主体;若所述码流头部中第一专用比特的值为0,第二专用比特的值为1,且512个比特中所述高斯密度函数对应的比特的值为1,则将所述高斯密度函数对应的二值化后的第一累积梯度向量的32个比特和第二累积梯度向量的32个比特分别依次连接构成码流主体;若所述码流头部的512个比特中所述高斯密度函数对应的比特的值为0,则所述高斯密度函数对应的二值化后的第一累积梯度向量和/或第二累积梯度向量不用于组成码流主体。4...

【专利技术属性】
技术研发人员:段凌宇林杰王哲杨爽陈杰黄铁军高文
申请(专利权)人:北京大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1