信息检索服务提供装置及方法、信息检索服务提供用数据库的构筑装置、以及计算机程序信号制造方法及图纸

技术编号:9384800 阅读:115 留言:0更新日期:2013-11-28 02:53
信息检索服务系统(40)包括:存储装置(64),存储提问句语料库;聚类处理部(100),对提问句进行群集化,确定各群集的模型;拍卖执行部(104),进行模型的拍卖;更新部(112),对各个提问句关联其所属群集的模型句的中标者;提问句-URL对照DB(68),对各个提问句,存储由中标者指定的URL;提问句检索部(132),接收检索请求,检索与检索请求之间的距离最小的提问句;以及URL检索部(134、136)和查询发出部(138),向与检索到的提问句对应的URL,发送根据检索请求生成的查询,并将得到的信息发送给服务利用终端(48)。

【技术实现步骤摘要】
【国外来华专利技术】信息检索服务提供装置及方法、信息检索服务提供用数据库的构筑装置
本专利技术涉及根据自然语言句的发声来检索用户需要的信息并提示的信息检索服务,尤其涉及将来自用户的信息检索请求分配给任一信息提供服务商,并且将该信息提供服务商提供的信息直接提示给用户的服务。
技术介绍
所谓的因特网上存在大量信息。并且该信息的量正在日益增加。但是,无论因特网上存在多么有用的信息,只要无法准确找到该信息,就没有任何意义。针对因特网用户的这种要求应运而生的就是所谓的检索网站。检索网站大致分为两类。第一类检索网站是检索网站的管理者手动或自动收集URL(UniformResourceIdentifier,统一资源定位符),按照其内容对各URL进行了分类的网站。用户按照检索网站的分类寻找自己要利用的网站。这种网站中准备的往往是限定分类范围,在其中检索期望的单词或单词串的机制。第二类检索网站预先生成与单词或单词串对应的网站的索引,接收指定了单词或单词串的检索请求后,使用索引进行检索,并返回检索结果。在此情况下,一般对检索结果打分,从分数高的网站开始依次向用户提示。因此,在此情况下,打分方法成为关键问题。依靠打分方法,提示与检索目的相应的准确的网站的可能性变大。在第一类检索网站中,至少需要知道自己要寻找的信息的分类。并且,该分类方式必须与检索网站利用的分类方式一致。并且,在这种检索网站中,存在着难以登记大量网站的问题。网站数增加后,相同分类下列出非常多的网站,找到期望网站变得极为困难。这种检索网站中,在利用单词或单词串检索网站的情况下,若不知道准确的单词组合,则也很可能无法得到期望信息。第二类检索网站中,仅仅作为检索词输入单词或单词串就会显示结果,因此与第一类检索网站相比操作更简单。但是,在这种检索网站中,为了准确地得到自己期望的信息,使用怎样的单词或单词串才能得到准确的结果这一知识也是很重要的。否则,只会显示与自己所需的网站不同的网站。相反,从进行信息提供服务的商家来看,存在着自己提供的服务若不显示在检索结果的前列,则用户甚至无法知道自己提供的服务的问题。因此,网站运营者不得不关注如何使自己的网站显示在检索结果前列的问题,这与提供服务的技术本身是截然不同的问题。鉴于上述问题,提出了并不仅仅对来自用户的检索请求做出响应,还检索与基于用户的当前位置信息或者请求服务内容信息的检索条件一致的服务提供者信息的服务信息提供装置(JP特开2010-282410号公报)。该服务信息提供装置对被检索到的服务提供者进行基于来自用户的请求的信息提供请求,并对用户提供得到的服务信息。
技术实现思路
专利技术要解决的问题根据上述JP特开2010-282410号公报中公开的服务信息提供装置,能够对用户提供适合用户当前位置的服务信息。但是,这种服务信息提供装置存在着无法利用其自身的服务取得效益的问题。该问题并不限于此种情况,因特网上提供的服务几乎都存在怎么将自己提供的服务与商业相结合的问题。结果往往是,在检索结果或信息提供的画面上提示广告,以获取广告收入。但是,这种仅依赖广告的服务并不是理想的商业模式。需要一种将服务本身的价值与商业相结合的机制。另外,从原始的服务提供者的立场来看,存在着在上述服务信息提供系统中,自己提供的服务只不过是众多服务之一的问题。即,对于任一服务提供者而言,都存在着无法以较大可能性将潜在用户引导至自己的服务的问题。从服务提供者角度来看,需要一种限定于满足特定条件的某种信息提供请求,将自己的服务作为检索结果提示给用户的机制。但是,以往并不存在这种机制,无论是对于服务信息提供者,还是对于服务提供者,都存在着作为利用因特网的商业,运营不透明的问题。因此,本专利技术的目的之一在于提供一种信息检索服务提供装置,在运营针对与因特网上的服务有关的检索请求的信息检索服务时,能够将该服务自身与商业上的效益相结合。本专利技术的另一目的在于提供一种信息检索服务提供装置及方法,以及实现该装置及方法的数据库构筑装置,在运营针对与因特网上的服务有关的检索请求的信息检索服务时,能够采用对满足特定条件的检索请求单独返回特定的服务提供者的服务的机制,并将这种机制确立为商业模式。解决问题的方案本专利技术第一局面所涉及的信息检索服务提供装置包括:机器可读的存储装置,存储机器可读的多个句子;网络接口;拍卖执行装置,连接于存储装置和网络接口,通过经由网络接口的在线拍卖将存储装置中存储的多个句子中的每个与中标者及中标价格相关联;URI存储装置,连接于存储装置、网络接口、以及拍卖执行装置,对于多个句子的每个,接收并存储由利用拍卖执行装置与该句子相关联的中标者经由网络接口指定的URI;句子检索装置,连接于网络接口以及存储装置,经由网络接口接收了信息的检索请求句之后做出响应,在存储装置存储的多个句子中,检索与该检索请求句之间定义的距离最小的句子;以及信息发送装置,连接于句子检索装置以及URI存储装置,向与由句子检索装置检索到的句子对应存储在URI存储装置中的URI,发送根据检索请求句生成的查询,据此将从该URI得到的信息发送到发送了检索请求句的终端。较为理想的是,拍卖执行装置包括:代表句确定装置,连接于存储装置,将存储装置存储的多个句子以句与句之间定义的距离为基准分为多个群集,并确定代表各群集的代表句;代表句拍卖执行装置,连接于代表句确定装置以及网络接口,对于各个代表句进行在线拍卖,据此对于各个代表句确定中标者以及中标价格;价格赋予装置,连接于代表句拍卖执行装置以及存储装置,在代表句拍卖执行装置的拍卖结束之后做出响应,对多个句子的每个,关联该句子所属的群集的代表句的中标者以及中标价格;以及URI存储装置,连接于网络接口、存储装置、以及价格赋予装置,对于多个句子的每个,响应于经由网络接口来自与该句子相关联的中标者的URI的输入,与该句子相关联地存储该URI。更为理想的是,代表句确定装置以及句子检索装置中的距离通过相同的方法计算。进一步理想的是,信息发送装置包括:映射规则存储装置,对于URI存储装置存储的各个URI,存储用于生成向该URI发送的查询的查询模板、以及用于将检索请求句中包含的单词映射到查询模板内的单词插入位置以生成查询的映射规则;句法分析装置,在句子检索装置接收信息检索请求句后做出响应,进行对该检索请求句的句法分析,以对各单词赋予属性,并输出带属性检索请求句;查询发送装置,基于由句子检索装置检索到的句子、以及对应于与该句子相关联的URI存储在映射规则存储装置中的模板和映射规则,生成查询,并发送到对应于由句子检索装置检索到的句子存储在URI存储装置中的URI;以及信息转发装置,将针对由查询发送装置发送的查询的回复转发到发送了检索请求句的终端。每个代表句可以包含赋予了预先确定的属性种类及其属性值的关键字。拍卖执行装置可以包括:包含关系存储装置,对于每个属性种类,存储规定属性值的包含关系的包含关系信息;投标装置,对于每个代表句,针对该代表句中包含的关键字的每个属性种类,从投标者接收指定了其属性值和投标价格的投标;以及中标者确定装置,对于投标装置接收的投标,按照包含关系存储装置中存储的包含关系和投标价格,确定相互排他的中标范围,并确定各代表句的中标者。较为理想的是,中标者确定装置包括:包含关系判定装置本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201280005941.html" title="信息检索服务提供装置及方法、信息检索服务提供用数据库的构筑装置、以及计算机程序信号原文来自X技术">信息检索服务提供装置及方法、信息检索服务提供用数据库的构筑装置、以及计算机程序信号</a>

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2011.01.21 JP 2011-0110901.一种信息检索服务提供装置,其特征在于,包括:机器可读的存储装置,存储机器可读的多个自然语言句;网络接口;拍卖执行装置,连接于所述存储装置和所述网络接口,通过经由所述网络接口的在线拍卖将所述存储装置中存储的多个所述自然语言句中的每个与中标者及中标价格相关联;URI存储装置,连接于所述存储装置、所述网络接口、以及所述拍卖执行装置,对于多个所述自然语言句的每个,接收并存储由利用所述拍卖执行装置与该自然语言句相关联的中标者经由所述网络接口指定的URI;句子检索装置,连接于所述网络接口以及所述存储装置,经由所述网络接口接收了信息的检索请求句之后做出响应,在所述存储装置存储的多个所述自然语言句中,检索与该检索请求句之间定义的距离最小的自然语言句;以及信息发送装置,连接于所述句子检索装置以及所述URI存储装置,向与所述句子检索装置检索到的自然语言句对应存储在所述URI存储装置中的URI,发送根据所述检索请求句生成的查询,据此将从该URI得到的信息发送到发送了所述检索请求句的终端,所述拍卖执行装置包括:代表句确定装置,连接于所述存储装置,将所述存储装置存储的多个所述自然语言句以句与句之间定义的距离为基准分为多个群集,并确定代表各群集的代表句;代表句拍卖执行装置,连接于所述代表句确定装置以及所述网络接口,对于各个所述代表句进行在线拍卖,据此对于各个所述代表句确定中标者以及中标价格;以及价格赋予装置,连接于所述代表句拍卖执行装置以及所述存储装置,在所述代表句拍卖执行装置的拍卖结束之后做出响应,对多个所述自然语言句的每个,关联该自然语言句所属的群集的代表句的中标者以及中标价格。2.根据权利要求1所述的信息检索服务提供装置,其特征在于:所述代表句确定装置以及所述句子检索装置中所涉及的距离通过相同的方法计算。3.根据权利要求1所述的信息检索服务提供装置,其特征在于:每个所述代表句包含赋予了预先确定的属性种类及其属性值的关键字;所述代表句拍卖执行装置包括:包含关系存储装置,对于每个属性种类,存储规定属性值的包含关系的包含关系信息;投标装置,对于每个所述代表句,针对该代表句中包含的关键字的每个属性种类,从投标者接收指定了其属性值和投标价格的投标;以及中标者确定装置,对于所述投标装置接收的投标,按照所述包含关系存储装置中存储的包含关系和投标价格,确定相互排他的中标范围,并确定各代表句的中标者。4.根据权利要求3所述的信息检索服务提供装置,其特征在于:所述中标者确定装置包括:包含关系判定装置,关于针对相同的代表句对相同关键字的属性种类指定不同属性值进行的多个投标,基于关于该属性而存储在所述包含关系存储装置中的包含关系,判定由指定的属性值分别确定的范围之间的包含关系;以及按照所述包含关系判定装置的包含关系判定结果,对所述代表句确定由属性值指定的中标范围,对于各中标范围,根据指定了相应属性值的投标价格来确定中标者的装置。5.根据权利要求1所述的信息检索服务提供装置,其特征在于还包括:收费装置,连接于所述信息发送装置,在所述信息发送装置发送了信息之后做出响应,执行收费处理,该收费处理对应于与触发了该发送的、由所述句子检索装置检索到的自然语言句建立了对应的中标者以及中标价格。6.一种信息检索服务提供装置,其特征在于:机器可读的存储装置,存储机器可读的多个自然语言句;网络接口;拍卖执行装置,连接于所述存储装置和所述网络接口,通过经由所述网络接口的在线拍卖将所述存储装置中存储的多个所述自然语言句中的每个与中标者及中标价格相关联;URI存储装置,连接于所述存储装置、所述网络接口、以及所述拍卖执行装置,对于多个所述自然语言句的每个,接收并存储由利用所述拍卖执行装置与该自然语言句相关联的中标者经由所述网络接口指定的URI;句子检索装置,连接于所述网络接口以及所述存储装置,经由所述网络接口接收了信息的检索请求句之后做出响应,在所述存储装置存储的多个所述自然语言句中,检索与该检索请求句之间定义的距离最小的自然语言句;以及信息发送装置,连接于所述句子检索装置以及所述URI存储装置,向与所述句子检索装置检索到的自然语言句对应存储在所述URI存储装置中的URI,发送根据所述检索请求句生成的查询,据此将从该URI得到的信息发送到发送了所述检索请求句的终端,所述信息发送装置包括:映射规则存储装置,对于所述URI存储装置存储的各个URI,存储用于生成向该URI发送的查询的查询模板、以及用于将所述检索请求句中包含的单词映射到所述查询模板内的单词插入位置以生成查询的映射规则;句法分析装置,在所述句子检索装置接收信息的检索请求句后做出响应,进行对该检索请求句的句法分析,以对各单词赋予属性,并输出带属性检索请求句;查询发送装置,基于由所述句子检索装置检索到的自然语言句、以及对应于与该自然语言句相关联的URI存储在所述映射规则存储装置中的模板和映射规则,生成查询,并发送到对应于由所述句子检索装置检索到的自然语言句存储在所述URI存储装置中的URI;以及信息转发装置,将针对由所述查询发送装置发送的查询的回复转发到发送了所述检索请求句的终端。7.一种信息检索服务提供用数据库的构筑装置,其特征在于包括:机器可读的存储装置,存储机器可读的多个自然语言句;网络接口;拍卖执行装置,连接于所述存储装置和所述网络接口,通过经由所述网络接口的在线拍卖将所述存储装置中存储的多个所述自然语言句中的每个与中标者及...

【专利技术属性】
技术研发人员:鸟泽健太郎大竹清敬颜玉兰史蒂恩·德萨哲伊什特万·瓦尔加风间淳一
申请(专利权)人:独立行政法人情报通信研究机构
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1