System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息处理程序、信息处理方法以及信息处理装置制造方法及图纸_技高网

信息处理程序、信息处理方法以及信息处理装置制造方法及图纸

技术编号:40039857 阅读:6 留言:0更新日期:2024-01-16 19:33
信息处理装置按类似的矢量对储存于文件的多个句子的矢量进行分类,生成将句子的矢量与句子的文件上的位置建立了对应关系的转置索引。信息处理装置在受理包含多个句子的检索查询的情况下,从检索查询所包含的多个句子确定出特征句子。信息处理装置基于特征句子的矢量、转置索引的各矢量、以及分类的结果确定出表示与特征句子的矢量类似的矢量的多个类似矢量。信息处理装置针对多个类似矢量,基于类似矢量以及转置索引确定出第1推移数据,该第1推移数据表示类似矢量的前后的位置的矢量的推移。信息处理装置从多个类似矢量的第1推移数据确定出与第2推移数据类似的推移数据,该第2推移数据表示检索查询中的特征句子的前后的句子的矢量的推移。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及信息处理程序等。


技术介绍

1、在db(data base:数据库)中登记有大量的文本数据,要求从db适当地检索与利用者的输入数据类似的数据。

2、对进行数据检索的以往的服务器的一个例子进行说明。在服务器执行数据检索的情况下,以单词、句子、项~文档等粒度进行检索,但这里作为一个例子,对检索与检索查询类似的项的服务器进行说明。例如,检索查询由项的粒度指定,项包含有多个句子。

3、服务器在项的粒度的检索的情况下,使用定义了单词的矢量的静态词典等计算db所包含的项的矢量,预先生成表示项的矢量与项的db上的位置的关系的转置索引。例如,服务器通过累计项所包含的多个句子的矢量来计算项的矢量。句子的矢量通过累计句子所包含的多个单词的矢量而计算。

4、若服务器受理项的粒度检索查询,则与计算db上的项的矢量的情况相同地计算检索查询的项的矢量,将检索查询的项的矢量与转置索引进行比较,确定出与检索查询类似的项的位置。服务器将确定出的项的信息作为检索结果进行响应。

5、专利文献1:日本特开2011-118689号公报

6、专利文献2:国际公开第2020/213158号

7、然而,在上述的现有技术中,存在与检索查询类似的数据检索不是高精度这样的问题。

8、例如,在针对项的粒度的转置索引中设定的多个项的矢量,分别根据检索查询的项的矢量筛选类似的项的候补的情况下,由于候补的各项由多个句子构成,各个句子矢量和其推移不同,所以检索的精度降低。


技术实现思路

1、在一个方面,本专利技术的目的在于提供能够高精度并且高效地进行与检索查询类似的数据检索的信息处理程序、信息处理方法以及信息处理装置

2、在第1方案中,使计算机执行如下处理。计算机按类似的矢量对储存于文件的多个文的矢量进行分类,生成将句子的矢量与句子的文件上的位置建立了对应关系的转置索引。计算机在受理了包含多个句子的检索查询的情况下,从检索查询所包含的多个句子确定出特征句子。计算机基于特征句子的矢量、转置索引的各矢量以及分类的结果确定出表示与特征句子的矢量类似的矢量的多个类似矢量。计算机针对多个类似矢量,基于类似矢量以及转置索引确定出第1推移数据,上述第1推移数据表示类似矢量的前后的位置的矢量的推移。计算机从多个类似矢量的第1推移数据确定出与第2推移数据类似的推移数据,上述第2推移数据表示检索查询中的特征句子的前后的句子的矢量的推移。

3、专利技术效果

4、能够高精度并且高效地进行与检索查询类似的数据检索。

本文档来自技高网...

【技术保护点】

1.一种信息处理程序,其特征在于,

2.根据权利要求1所述的信息处理程序,其特征在于,

3.根据权利要求1所述的信息处理程序,其特征在于,

4.根据权利要求3所述的信息处理程序,其特征在于,

5.根据权利要求1所述的信息处理程序,其特征在于,

6.一种信息处理方法,其特征在于,

7.根据权利要求6所述的信息处理方法,其特征在于,

8.根据权利要求6所述的信息处理方法,其特征在于,

9.根据权利要求8所述的信息处理方法,其特征在于,

10.根据权利要求6所述的信息处理方法,其特征在于,

11.一种信息处理装置,其特征在于,

12.根据权利要求11所述的信息处理装置,其特征在于,

13.根据权利要求11所述的信息处理装置,其特征在于,

14.根据权利要求13所述的信息处理装置,其特征在于,

15.根据权利要求11所述的信息处理装置,其特征在于,

【技术特征摘要】
【国外来华专利技术】

1.一种信息处理程序,其特征在于,

2.根据权利要求1所述的信息处理程序,其特征在于,

3.根据权利要求1所述的信息处理程序,其特征在于,

4.根据权利要求3所述的信息处理程序,其特征在于,

5.根据权利要求1所述的信息处理程序,其特征在于,

6.一种信息处理方法,其特征在于,

7.根据权利要求6所述的信息处理方法,其特征在于,

8.根据权利要求6所述的信息处理方法,其特征...

【专利技术属性】
技术研发人员:片冈正弘松村量永浦良平
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1