搜索方法、搜索程序以及搜索装置制造方法及图纸

技术编号:11643385 阅读:73 留言:0更新日期:2015-06-24 21:18
本公开涉及一种搜索方法、搜索程序以及搜索装置。根据实施例的搜索装置基于包括节点和距离的参数将特征向量映射在超球体上,其中,在交点处m维特征空间与经过该超球体的直线相交,该超球体存在于维度比m更大的空间中,该距离是从超球体的北极至特征空间的距离。在这种情况下,搜索装置搜索允许映射在超球体上的特征向量的位置集中在超球体的预定半球上的参数。

【技术实现步骤摘要】

本文所公开的实施例涉及搜索方法等。
技术介绍
例如,为了认证各种系统的用户,而获取用户的生物统计信息,然后,确定与所获 取的生物统计信息匹配的生物统计信息是否已被数据库所预先记录并且能在该数据库中 找到。这里,由于在认证时要获取的生物统计信息很少完全匹配在登记时获取的生物统计 信息,所以能够有效地执行相似性搜索。 为了表达用于执行相似性搜索的相似性等级,可使用将生物统计信息的特征值 转换成散列向量(hash vetor)的技术。该技术将具有相近汉明距离(close hamming distance)的散列向量的每条生物统计信息识别为相似生物统计信息。 传统技术已采用超平面将特征值转换成散列向量。然而,还可使用采用超球体将 特征值转换成散列向量的技术,并且期望使用超球体的技术实现精度改善。 引用文献列表 专利文献 专利文献1 :日本已公开专利公布第2011-100395号 专利文献2 :日本已公开专利公布第2012-160047号 专利文献3 :日本已公开专利公布第2011-39755号 非专利文献 非专利文献 I : Jae-Pil Heo, Youngwoon Lee, Junfeng He, Shih-Fu Chang, and Sung-Eui Yoon, "Spherical hashing",in CVPR,pp. 2957-2964,2012。 非专利文献 2 :Kengo Terasawa and Yuzuru Tanaka, "Spherical Ish for approximate nearest neighbor search on unit hyper-sphere^,in Frank K. H. A. Dehne, Jorg-Rudiger Sack, and Norbert Zeh, editors, WADS, Vol. 4619 of Lecture Notes in Computer Science,pp.27-38. Springer, 2007。 然而,前述传统技术引起了利用超球体计算散列向量将导致计算量增加的问题。 此外,当利用超球体将特征向量转换成散列向量时,虫孔(wormhole)可以引起甚 至明显不同的特征向量,从而在转换成散列向量后具有缩短的汉明距离。由于这个原因,那 些不同的特征向量会被错误地确定为相似特征向量。 因此,本专利技术的一个实施例的一个方面的目的是提供一种以简单方式利用超球体 实现要执行的相似性搜索的搜索方法、搜索程序以及搜索装置
技术实现思路
根据实施例的一个方面,一种搜索方法包括:获取在数据库中存储的第一维特征 向量;以及搜索以下参数:当特征向量基于包括交点和距离的所述参数映射在球体的表面 上时,通过所述参数,要映射在所述球体的表面上的特征向量的位置集中在所述球体的半 球上,在该交点处特征空间与经过该球体的直线相交,,该球体存在于维度比该特征空间大 一维或更多维的空间中,该距离是从球体的预定点至该特征空间的距离。【附图说明】 图1是例示根据第一实施例的搜索装置的配置的功能块图。 图2A是例示特征值存储单元的示例数据结构的视图。 图2B是例示位串存储单元的示例数据结构的视图。 图3是例示特征空间V与超球体S之间的关系的第一视图。 图4是例示特征空间V与超球体S之间的关系的第二视图。 图5是例示通过根据第一实施例的搜索装置所执行的过程的流程图。 图6是例示根据第一实施例的参数识别处理的过程的流程图。 图7是例示在无限远点周围的捷径(shortcut)的说明视图。 图8是例示通过逆立体投影将特征向量映射在超球体的东半球上的参数的示例 的视图。 图9是例示通过逆立体投影将特征向量映射在超球体的西半球上的参数的示例 的视图。 图10是例示根据第二实施例的搜索装置的配置的功能块图。 图11是例示近似直线的示例的视图。 图12是例示根据第二实施例的参数识别处理的过程的流程图。 图13是例示根据第三实施例的搜索装置的配置的功能块图。 图14是例示通过爬山搜索而执行的参数识别处理的过程的流程图。 图15是例示通过马尔可夫链蒙特卡罗方法执行的参数识别处理的过程的流程 图。 图16是例示通过群智能执行的参数识别处理的过程的流程图。 图17是例示目标函数的过程的示例的流程图。 图18是例示用于执行搜索程序的计算机的示例的视图。【具体实施方式】 将参考附图来解释本专利技术的优选实施例。注意,本专利技术不限于这些实施例。 第一实施例 将描述根据第一实施例的搜索装置的配置的示例。图1是例示根据第一实施例的 搜索装置的配置的功能块图。如图1中所例示的,搜索装置100包括特征值存储单元101、查 询存储单元102、位串存储单元103、逆立体投影单元104a和104b以及位串产生单元105a 和105b。搜索装置100还包括超平面放置单元106、转换规则产生单元107、参数设置单元 108、汉明距离计算单元109以及相似向量识别单元110。 特征值存储单元101存储多个特征向量。图2A是例示特征值存储单元的示例数 据结构的视图。如图2A中所例示的,特征值存储单元101将识别信息和特征向量以彼此相 关联的方式进行存储。识别信息唯一地识别特征向量。特征向量例如是从用户的生物统计 信息中获得的m维特征值数据。为了从生物统计信息确定特征值,可以采用任意传统技术。当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种通过计算机执行的搜索方法,所述搜索方法包括:获取在数据库中存储的第一维特征向量;以及搜索以下参数:当所述特征向量基于包括交点和距离的所述参数而映射在球体的表面上时,通过所述参数,要映射在所述球体的表面上的特征向量的位置集中在所述球体的半球上,在所述交点处特征空间与经过所述球体的直线相交,所述球体存在于维度比所述特征空间大一维或更多维的空间中,所述距离是从所述球体的预定点至所述特征空间的距离。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:野间唯此岛真喜子
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1