检索装置制造方法及图纸

技术编号:10148854 阅读:114 留言:0更新日期:2014-06-30 17:28
检索部(60)从字符串检索用索引(40)取得与检索查询(70)部分一致的展开源文档数据来计算字符串类似度,从关系数据展开用索引(50)取得定义了与展开源文档数据的关系性的展开目的地文档数据,利用展开目的地文档数据的字符串类似度以及关系权重数据(80)来进行修正而求出关系数据展开类似度,输出按照关系数据展开类似度的顺序进行了排列的检索结果(90)。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】检索部(60)从字符串检索用索引(40)取得与检索查询(70)部分一致的展开源文档数据来计算字符串类似度,从关系数据展开用索引(50)取得定义了与展开源文档数据的关系性的展开目的地文档数据,利用展开目的地文档数据的字符串类似度以及关系权重数据(80)来进行修正而求出关系数据展开类似度,输出按照关系数据展开类似度的顺序进行了排列的检索结果(90)。【专利说明】检索装置
本专利技术涉及将检索查询的一部分用作检索关键字而对索引进行模糊检索的检索装置。
技术介绍
在检索乐曲名或者设施名等时,利用者未必记着正确的名称,而有时将通称、简称或者模糊记忆的错误的名称等作为检索关键字来进行检索。另外,在如车辆导航装置以及智能手机那样作为输入设备不具有键盘的终端以及仪器中,还有时将对来自麦克风的声音信号进行声音识别而得到的结果、以及对来自触摸面板的输入进行字符识别而得到的结果等作为检索关键字进行检索。不论在哪一种情况下都需要如下技术,即,不仅是正式名称而且还对字符串或者发音类似的名称进行模糊检索的技术。作为上述那样的能够进行模糊检索的以往的检索技术的一个例子,提出了专利文献I。该专利文献I的专利技术是使用检索 词的部分字符串来进行模糊检索的检索装置,检索词中的部分字符串包含于检索对象字符串中的比率越高、并且在检索对象字符串中越是位于前方,越给予高的评价,从而能够在设施名检索中得到符合利用者的感觉的合适的检索结果。这一般在日语中对设施等赋予名称的情况下,具有以使应强调的字句位于名称的前方的方式决定的倾向,利用具有如下倾向的特性:利用者通常感觉在检索对象字符串中检索词位于前方的情况相比于位于后方的情况,检索对象字符串与检索词的相关性更强。例如,如果将“ΑΒ⑶’ > K”这样的设施名作为检索词来输入,则检索装置检索包括作为其部分字符串的“AB” “BC” “⑶” “D 9 ” “ 9 “ > F'”的检索对象字符串。在作为其检索结果而得到了“ΑΒ⑶9 > K”和“〇X銀行AB⑶9 >卜''出張所”这样的2个检索对象字符串的情况下,对利用者期望的可能性高的“ABCD 7 > F'”给予更高的评价。另一方面,在检索乐曲名以及设施名等的情况下,将相互具有关系的多个关键词用作检索关键字来检索的情况较多。通过按照例如“〈艺术家名 >〈曲名 >”、“〈市镇村名>〈设施名〉”这样的形式进行检索,从而相比于只是简单地通过曲名或者设施名来进行检索,缩小检索结果的范围,能够期待得到更合适的检索结果。作为这样的考虑了相互具有关系的关键词之间的关系性的以往的检索技术的一个例子,提出了专利文献2。该专利文献2的专利技术是将设施名和所附随的信息事先关联起来、并针对所附随的每个信息而构成索引的检索装置,根据检索询问中的语句来确定附随信息,根据所确定的附随信息来搜寻索引而得到检索结果。例如,如果输入了“猪骨细面条”这样的检索询问,则检索装置确定“猪骨”是属于附随信息“味”的关键词,检索事先制作了的味的索引数据来得到相应的设施名。另外,检索装置确定“细面条”是属于附随信息“面条”的关键词,检索事先制作的面条的索引数据来得到相应的设施名。然后,综合这些检索结果,将相应的设施名的一览作为检索结果而向利用者进行提示。专利文献1:日本特开2003-44515号公报专利文献2:日本特开2009-211683号公报
技术实现思路
但是,在上述专利文献I中,虽然能够进行考虑了字符串的类似性的模糊检索,但存在如下课题:即使按照“〈艺术家名X曲名 >”以及“〈市镇村名X设施名 >”这样的形式进行检索,也无法进行利用了关键词之间的相互的关系性的检索。例如,在乐曲检索中,当输入了如“〈艺术家名X曲名 >”那样组合相互有关系的艺术家名和曲名得到的检索词的情况下,即使艺术家名不同也对同一曲名赋予同一评价,无法将检索词中的艺术家名反映到检索结果中。为了将艺术家名反映到检索结果,还能够生成将艺术家名和曲名连结而成的检索对象字符串的索引,但会导致索引的数据容量增大。另外,如果不仅制作与“〈艺术家名X曲名>”这样的模式对应的索引,而且还制作了与“〈艺术家名 >〈唱片集名 >”或者“〈唱片集名 >〈曲名 >”这样的多个模式对应的索弓丨,则需要更庞大的数据容量,存在不适用于车辆导航装置等嵌入式仪器这样的课题。另一方面,在上述专利文献2中,针对每个附随信息而具有索引数据,所以针对“猪骨”、“面条”等每个关键词,需要进行检索处理,存在检索处理时间变长这样的课题。另外,在与模糊检索并用时,无法唯一地确定检索询问中的各单词属于哪个附随信息,所以必须针对检索询问中的全部单词,检索所有的附随信息索引,存在在车辆导航装置等嵌入式仪器中无法以实用性的时间进行处理这样的课题。而且,在以往的检索装置中,利用了使用事先定义的词库等而将检索询问中的单词展开为所关联的另一单词来进行检索的方法,但在展开为另一单词之后进行模糊检索的情况下,与上述专利文献I同样地产生数据容量变得庞大这样的课题。另外,如果能够对向另一单词的展开自身进行模糊检索,则与上述专利文献2同样地产生组合的数量变得庞大而无法按照实用性的时间进行处理这样的课题。本专利技术是为了解决上述那样的课题而完成的,其目的在于,抑制索引的数据容量,并且进行利用了相互有关联的关键词之间的关系性的灵活的模糊检索。本专利技术的检索装置具备:字符串检索用索引,登记了成为检索对象的文档数据以及将该文档数据以规定单位进行分割得到的部分数据;关系数据展开用索引,定义了文档数据彼此的关系性以及该关系性的类别;字符串检索部,将检索查询分割为规定单位的部分数据,从字符串检索用索引取得与该部分数据部分一致的文档数据,计算类似度;以及关系数据展开检索部,将字符串检索部所取得的文档数据作为展开源,从关系数据展开用索引取得针对该展开源的文档数据定义了关系性的展开目的地的文档数据,使用与关系性的类别对应的权重以及该展开目的地的文档数据的类似度,修正该展开源的文档数据的类似度,按照该修正了的类似度的顺序来排列该展开源的文档数据而输出。根据本专利技术,与用于对检索查询进行模糊检索的字符串检索用索引独立地,准备对文档数据彼此的关系性以及关系性的类别进行了定义的关系数据展开用索引,考虑与检索查询部分一致的文档数据彼此的关系性及其类别来求出类似度,从而能够抑制字符串检索用索引的数据容量,并且进行利用了相互有关联的关键词之间的关系性的灵活的模糊检索。【专利附图】【附图说明】图1是示出本专利技术的实施方式I的检索装置的结构的框图。图2是示出实施方式I的检索装置的索引生成部的详细构造的框图。图3是示出实施方式I的检索装置的检索部的详细构造的框图。图4是示出实施方式I的登记数据的例子的图。图5是示出实施方式I的关系定义列表的例子的图。图6是实施方式I的索引生成部的索引生成处理的流程图。图7是示出实施方式I的字符串检索用索引的结构例的图,示出将单词字符串作为检索关键字的情况。图8是示出实施方式I的字符串检索用索引的结构例的图,示出将音素串(phoneme string)作为检索关键字的情况。图9是示出实施方式I的字符串检本文档来自技高网
...

【技术保护点】
一种检索装置,具备:字符串检索用索引,登记了成为检索对象的文档数据以及将该文档数据以规定单位进行分割得到的部分数据;关系数据展开用索引,定义了所述文档数据彼此的关系性以及该关系性的类别;字符串检索部,将检索查询分割为所述规定单位的部分数据,从所述字符串检索用索引取得与该部分数据部分一致的文档数据,计算类似度;以及关系数据展开检索部,将所述字符串检索部所取得的所述文档数据作为展开源,从所述关系数据展开用索引取得针对该展开源的文档数据定义了所述关系性的展开目的地的文档数据,使用与所述关系性的类别对应的权重以及该展开目的地的文档数据的所述类似度,修正该展开源的文档数据的所述类似度,按照该修正了的类似度的顺序来排列该展开源的文档数据而输出。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:相川勇之冈登洋平
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1