The data management system for implementation has indexer architecture (200) and searcher (300). The index architecture (200) generates a peripheral vector similar to the case vector, and constructs the index information (40) used to determine the case vector based on the surrounding vector (40), which is the characteristic vector of the accumulated data. The Retriever (300) uses the index information (40) to determine the case vector corresponding to the surrounding vector that is exactly the same as the query vector, and outputs a retrieval result data set (60) based on the determined case vector, in accordance with the retrieval request designated as the query vector of any feature vector.
【技术实现步骤摘要】
【国外来华专利技术】数据管理系统、数据管理方法及程序
本专利技术的实施方式涉及数据管理系统、数据管理方法及程序。
技术介绍
近年来,伴随信息通信技术的发展,能够进行多种多样数据的收集或积蓄、大数据分析或大媒体分析等这样的以大规模数据为对象的信息处理技术被关注。在处理这样的大规模数据的系统中,伴随数据规模的加速扩大的计算量的庞大化涉及到服务的劣化,所以如何能够削减计算量成为重要的课题。在数据库检索等数据检索中,作为高速进行图像或音乐等媒体检索的方法,进行使用了多维的特征矢量的相似性检索。在该相似性检索中,包含特征矢量间的相似度计算的矢量附近检索、即、从成为检索对象的特征矢量(以下,将其称为“事例矢量”)群之中找出与某特征矢量(以下,将其称为“查询(query)矢量”)接近的特征矢量群的处理占据计算量的大多数。因此,希望能够削减矢量附近检索的计算量而缩短数据检索的执行时间。现有技术文献专利文献专利文献1:(日本)特开2000-35965号公报专利文献2:(日本)特开2001-52024号公报
技术实现思路
专利技术要解决的课题本专利技术要解决的课题是,提供能够削减矢量附近检索的计算量而缩短数据检索的执行时间的数据管理系统、数据管理方法及程序。用于解决课题的手段实施方式的数据管理系统具备索引构筑部和检索部。索引构筑部生成与作为所积蓄的数据的特征矢量的事例矢量类似的周边矢量,构筑用于确定与所生成的所述周边矢量对应的所述事例矢量的索引信息。检索部按照指定了作为任意的特征矢量的查询矢量的检索请求,使用所述索引信息,确定与所述查询矢量完全一致的所述周边矢量所对应的所述事例矢量,输出基于所确定的 ...
【技术保护点】
一种数据管理系统,其中,具备:索引构筑部,生成与作为所积蓄的数据的特征矢量的事例矢量类似的周边矢量,构筑用于确定与所生成的所述周边矢量对应的所述事例矢量的索引信息;以及检索部,按照指定了作为任意的特征矢量的查询矢量的检索请求,使用所述索引信息,确定与所述查询矢量完全一致的所述周边矢量所对应的所述事例矢量,输出基于所确定的所述事例矢量的检索结果。
【技术特征摘要】
【国外来华专利技术】1.一种数据管理系统,其中,具备:索引构筑部,生成与作为所积蓄的数据的特征矢量的事例矢量类似的周边矢量,构筑用于确定与所生成的所述周边矢量对应的所述事例矢量的索引信息;以及检索部,按照指定了作为任意的特征矢量的查询矢量的检索请求,使用所述索引信息,确定与所述查询矢量完全一致的所述周边矢量所对应的所述事例矢量,输出基于所确定的所述事例矢量的检索结果。2.如权利要求1所述的数据管理系统,其中,所述索引构筑部构筑所述索引信息,该所述索引信息至少包含在列要素中具有第一列和第二列的表、以及针对该表中的所述第一列的索引,所述第一列储存所述周边矢量,所述第二列储存与该周边矢量所对应的所述事例矢量相关的信息,所述检索部使用所述索引,求取与所述查询矢量完全一致的所述周边矢量所对应的所述表的记录,基于在所求取的记录的所述第二列中储存的信息来确定所述事例矢量。3.如权利要求2所述的数据管理系统,其中,作为所述表的数据结构,使用将在所述第一列中储存的所述周边矢量作为键、将在所述第二列中储存的信息作为值的关联数组或连续存储器配置型数组。4.如权利要求2所述的数据管理系统,其中,所述索引构筑部构筑所述索引信息,该所述索引信息包含在列要素中除了所述第一列及所述第二列之外还具有第三列的所述表、以及针对该表中的所述第一列及所述第三列的复合索引,所述第三列储存所述周边矢量相对于所述事例矢量的相似度,所述检索部使用所述复合索引,求取与所述查询矢量完全一致并且所述相似度满足条件的所述周边矢量所对应的所述表的记录,基于在所求取的记录的所述第二列中储存的信息来确定所述事例矢量。5.如权利要求4所述的数据管理系统,其中,作为所述表的数据结构,使用将在所述第一列中储存的所述周边矢量及在所述第三列中储存的所述相似度作为键、将在所述第二列中储存的信息作为值的关联数组或连续存储器配置型数组。6.如权利要求1所述的数据管理系统,其中,所述索引构筑部构筑所述索引信息,所述索引信息包含在列要素中具有储存所述周边矢量的第一列和储存该周边矢量相对于所述事例矢量的相似度的第二列的第一表、在列要素中具有储存该第一表的记录的行ID的第一列和储存与该记录的所述周边矢量所对应的所述事例矢量相关的信息的第二列的第二表、以及针对所述第一表中的所述第一列及所述第二列的复合索引,所述检索部使用所述复合索引,求取与所述查询矢量完全一致并且所述相似度满足条件的所述周边矢量所对应的所述第一表的记录的行ID,基于在储存了所求取的行ID的所述第二表的记录的第二列中储存的信息,来确定所述事例矢量。7.如权利要求1所述的数据管理系统,其中,所述索引构筑部按照与所述查询矢量完全一致的所述周边矢量的值,构筑用于搜索与所述周边矢量所对应的所述事例矢量相关的信息的索引,作为所述索引信息,所述检索部使用所述索引,确定与所述查询矢量完全一致的所述周边矢量所对应的所述事例矢量。8.如权利要求1所述的数据管理系统,其中,所述索引构筑部按照与所述查询矢量完全一致的所述周边矢量的值和该周边矢量相对于所述事例矢量的相似度的条件,构筑用于搜索与所述周边矢量所对应的所述事例矢量相关的信息的复合索引,作为所述索引信息,所述检索部使用所述复合索引,确定与所述查询矢量完全一致并且所述相似度满足条件的所述周边矢量所对应的所述事例矢量。9.如权利要求1至8的任一项所述的数据管理系统,其中,所述检索部在所述检索请求包含输出件数的指定的情况下,一边将所述周边矢量相对于所述事例矢量的相似度的条件从严格一方起阶段性地变化,一边反复进行确定与所述查询矢量完全一致的所述周边矢量所对应的所述事例矢量的处...
【专利技术属性】
技术研发人员:浜田伸一郎,小野聪一郎,汤浅真由美,长田邦男,
申请(专利权)人:株式会社东芝,东芝数字解决方案株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。