分类方法及分类设备技术

技术编号:12034236 阅读:345 留言:0更新日期:2015-09-10 23:11
本申请涉及分类方法及分类设备,其中,分类方法包括:基于关于特征值空间的定义域的信息设置投影点的位置;以及通过使用所设置的投影点的位置将特征值空间中存在的向量投影到维度比特征值空间的维度高至少一个维度的空间中存在的球面。

【技术实现步骤摘要】

本文中所讨论的实施方式涉及例如用于分类的方法。
技术介绍
例如,为了认证用户,许多系统获取每个用户的生物信息,并且确定预先注册的数 据库中是否存在与所获取的生物信息相一致的生物信息。认证时所获取的生物信息很少与 注册时所获取的生物信息完全一致,因此相似性搜索是有效的。 如下技术已经得到了发展,其中,当执行相似性搜索时,生物信息的特征值被转换 成作为相似度的一种表达的散列向量,并且当生物信息的散列向量之间的汉明距离较小 时,生物信息被识别为相似的生物信息。 -些现有技术利用使用超平面将特征值转换为散列向量的处理,而其他现有技术 利用使用超球面将特征值转换为散列向量的处理,使用超球面比使用超平面更有可能提高 精度。 例如,在下面的专利文献中描述了传统技术: 日本早期公开专利公布No. 10-247243 ;以及 日本早期公开专利公布No. 2009-133798。 例如,在下面的非专利文献中描述了一些其他现有技术: M.Datar,N.Immorlica,P.Indyk,V.S.Mirrokni, ^Locality-SensitiveHashing SchemeBasedonp-StableDistributions",ProceedingsoftheTwentiethAnnual SymposiumonComputationalGeometry,SCG2004 ; Jae-PilHeo,YoungwoonLee,JunfengHe,Shih-FuChang,andSung-Eui Yoon,"SphericalHashing",InCVPR,pp. 2957-2964, 2012;以及 KengoTerasawaandYuzuruTanaka,''SphericalLSHforApproximateNearest NeighborSearchonUnitHypersphere^,InFrankK.H.A.Dehne,Jorg-RudigerSack,and NorbertZeh,editors,WADS,Vol. 4619ofLectureNotesinComputerScience,pp. 27-38 ,Springer,2007〇 然而,难以使用特征值向量精确地执行相似性搜索,这是一个问题。 假定调整投影点的位置以逆立体地将特征值数据仅投影到超球面S的朝向特征 值空间的一侧的表面上。调整后,可以输入特征值数据。在这样的情况下,特征值数据也可 以逆立体地被投影到超球面S的、穿过超球面S的与特征值空间相对的一侧的表面上,使得 已经被逆立体投影的特征值数据之间可以出现无限远处的点的捷径。 图29是用于解释无限远处的点的捷径的图。特征值空间V中无限远处的点被投 影到超球面S的北极上的一个点。因此,例如,特征值空间V中离点X。足够远的点p的逆 立体投影使点P与超球面S上的点p'相关联;以及特征值空间V中的点q的逆立体投影使 点q与超球面S上的q'相关联。这样的逆立体投影导致出现捷径。例如,在一些情况下, 经过无限远点附近的路径l〇b比经过特征值空间V的原点附近的路径10a要短。这样的情 况可以使得特征空间V中以距离10c彼此远离的点之间的距离比超球面S上的要小,并且 因此可以减小点P与点q的位串之间的汉明距离。 因此,本专利技术的实施方式的一个方面的目的是提供一种能够使用特征值向量精确 地执行相似性搜索的用于分类的方法、设备和程序。
技术实现思路
根据实施方式的一方面,分类方法包括:基于关于特征值空间的定义域的信息设 置投影点的位置;以及通过使用所设置的投影点的位置将特征值空间中存在的向量投影到 维度比特征值空间的维度高至少一个维度的空间中存在的球面。【附图说明】 图1是示出了根据本专利技术的第一实施方式的分类设备的系统配置的图; 图2是示出了特征值存储单元的数据结构的示例的图; 图3是示出了位串存储区的数据结构的示例的图; 图4是用于说明对投影点的位置进行设置的第一示例的图; 图5是用于说明对投影点的位置进行设置的第二示例的图; 图6是用于说明对投影点的位置进行设置的第三示例的图; 图7是示出了当投影点位于超球面S内部时一般化立体投影的图; 图8是示出了当投影点位于超球面S上时一般化立体投影的图; 图9是示出了当投影点位于超球面S外部时一般化立体投影的图; 图10是示出了当投影点位于超球面S外部并且具有在范围内的Z分量时 一般化立体投影的图; 图11是示出了其中使用一般化立体投影对超球面S的横截面进行投影的第一示 例的图; 图12是示出了其中使用一般化立体投影对超球面S的横截面进行投影的第二示 例的图; 图13是示出了其中使用一般化立体投影对超球面S的横截面进行投影的第三示 例的图; 图14是示出了其中使用一般化立体投影对超球面S的横截面进行投影的第四示 例的图; 图15是用于说明一般化逆立体投影的第一图; 图16是用于说明一般化逆立体投影的第二图; 图17是用于说明一般化逆立体投影的第三图; 图18是示出了特征值空间V与超球面S之间的关系的图⑴; 图19是示出了特征值空间V与超球面S之间的关系的图⑵; 图20是示出了设置参数的第一过程示例的图; 图21是示出了设置参数的第二过程示例的图; 图22是示出了根据本专利技术的第二实施方式的分类设备的系统配置的图; 图23是示出了设置参数的第三过程示例的图; 图24是示出了根据本专利技术的第三实施方式的分类设备的系统配置的图; 图25是示出了设置参数的第四过程示例的图; 图26是示出了设置参数的第五过程示例的图; 图27是示出了设置参数的第六过程示例的图; 图28是示出了目标函数的处理过程的示例的图; 图29是用于说明无限远处的点的捷径的图;以及 图30是示出了分类设备中的每个分类设备的硬件配置的图。【具体实施方式】 将参照附图对优选实施方式进行说明。需要注意的是,实施方式不限制本公开内 容的权利范围。除非实施方式的处理的细节彼此相冲突,否则可以恰当地对实施方式进行 组合。 第一实施方式 将使用图1对分类设备100的系统配置进行描述。图1是示出了根据本专利技术的第 一实施方式的分类设备的系统配置的图。如图1的示例所示,分类设备100包括超平面计 数存储单元121、特征值存储单元122、用于特征值空间的定义域的存储单元123、查询存储 单元124和位串存储区132。每个存储单元对应于存储设备诸如半导体存储器设备(如随 机存取存储器(RAM)、只读存储器(ROM)或闪速存储器)、硬盘或光盘。 分类设备100还包括用于一般化逆立体投影的参数设置单元111、一般化逆立体 投影单元112a、超平面布置单元113、转换规则生成单元114和位串生成单元115a。分类设 备100进一步包括一般化逆立体投影单元112b、位串生成单元115b和汉明距离计算单元 133。每个处理单元的功能可以通过集成电路诸如专用集成电路(ASIC)或现场可编程门阵 列(FPGA)来实现。每个处理单元的功能也可以通过例如由中央处理单元(CPU)执行某一 程序来实现。用于一般化逆立体投影的参数设置单元111是设置单元的一种示例。一般化 逆立体投影112a是投影单元的一种示例。 下面描述存储单元本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN104899901.html" title="分类方法及分类设备原文来自X技术">分类方法及分类设备</a>

【技术保护点】
一种分类方法,包括:基于关于特征值空间的定义域的信息设置投影点的位置;以及通过使用所设置的投影点的位置,将所述特征值空间中存在的向量投影到维度比所述特征值空间的维度高至少一个维度的空间中存在的球面。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:野间唯此岛真喜子
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1